分类: 学界业界动态

  • 模型上下文协议(MCP)技术介绍与应用展望

    随着AI技术的快速发展,大型语言模型(LLM)与外部数据源和工具的交互需求日益迫切。在最初的提示词工程阶段,我们可能会人工编写、从数据库中筛选或者使用工具检索可能需要的信息,再手动粘贴到提示词 prompt 中。随着我们要解决的问题越来越复杂,手工把信息引入到 prompt 中会变得越来越困难[1]

    此时,如AI柠檬博主上一篇博客文章提到的 Function Call 便被引入了进来。该机制允许大模型在需要时调用用户预先定义的函数来获取数据或执行操作,显著提升了自动化水平。而这一过程本质上是由大模型输出一个json格式内容,在字段指定参数值中告诉你应该调用什么函数,以及传入什么函数入参来实现。

    但工具函数调用这种传统API接口存在局限性,如兼容性差、安全隐患等,进而催生了模型上下文协议(Model Context Protocol, MCP)的诞生。这项由Anthropic公司于2024年11月推出的开放标准,被誉为“AI领域的USB-C接口”,旨在为AI应用与外部资源提供统一的通信框架[2]

    (更多…)
  • 面向深度学习用户的Nvidia各版本GPU参数汇总整理

    做深度学习离不开算力,就像到达诗和远方的旅途离不开交通工具。本文面向深度学习用户整理市面上常用的各个版本GPU的关键参数,进行汇总整理,方便大家随时查阅。如果数据有误,或有新GPU问世,或者需要补充的参数维度,各位看官可以及时通过联系方式来找我更新数据。

    注:仅统计Memory在 16GB以上、发售时间在2017年及以后、算力性能满足深度学习计算要求(Cuda算力性能>=7.0)的GPU。若表中单元格为空,则为暂无数据或数据待补充。博主将不定期移除上市时间最久、已停产过时、市面上已大量退役的GPU数据信息项。

    (当前数据整理截止为2025年3月)

    (更多…)
  • LLaMA:一个基于大语言模型的可本地私有化部署的聊天机器人

    最近,ChatGPT非常地火热,人们无处不在谈论它。众所周知,ChatGPT是一个基于深度学习的算法模型,是语言模型的一种,具有目前为止最接近人类水平的对话风格。不过OpenAI选择将其闭源,外部仅可通过API接口调用的方式使用它。因此,出于网络信息安全考量,中国的工信部、各个公司等均禁止使用OpenAI的ChatGPT,而OpenAI也不对中国大陆地区提供服务。

    不过GitHub上近期出现了基于大语言模型的开源项目LLaMA,可以本地私有化部署使用。其算法模型效果接近ChatGPT的水平,且支持GPU加速推理,不联网也可以正常使用,无需担心信息泄露的风险。

    (更多…)
  • 10分钟标注数据胜过一年前的960h数据,FAIR新研究取得语音识别大进展(模型已开源)

    近日,来自 FAIR 的研究者提出结合自训练和无监督预训练执行语音识别任务,证明这两种方法存在互补性,并取得了不错的结果。

    来自机器之心翻译,有修改 https://www.jiqizhixin.com/articles/2020-11-05-10

    自训练和无监督预训练已经成为使用无标注数据改进语音识别系统的有效方法。但是,我们尚不清楚它们能否学习类似的模式,或者它们能够实现有效结合。

    最近,Facebook 人工智能研究院(FAIR)一项研究显示,伪标注和使用 wav2vec 2.0 进行预训练在多种标注数据设置中具备互补性。

    只需来自 Libri-light 数据集的 10 分钟标注数据和来自 LibriVox 数据集的 5.3 万小时无标注数据,该方法就能在 Librispeech clean 和 other 测试集上取得 3.0%/5.2% 的 WER(词错率),甚至打败了仅仅一年前的基于 960 个小时标注数据训练的最优系统。在 Librispeech 所有标注数据上训练后,该方法可以达到 1.5%/3.1% 的词错率。

    (更多…)
  • ASRT开源语音识别项目开始兼容TensorFlow 2.X

    大约三周前,一位GitHub用户在ASRT开源语音识别项目提交了一个Issue,指出该项目不能运行于TensorFlow 2.X环境下,存在兼容问题。于是他上周向本项目提交了修改代码的Pull Request。经过本人实际测试,修改后的代码同时兼容TensorFlow 1.X版和2.X版,并且完全无错误正确运行。

    (更多…)
  • 西电华为俱乐部演讲:深度学习的应用

    近日,AI柠檬博主在西电华为俱乐部进行了关于深度学习应用相关的演讲,与各位同学分享深度学习的发展和最新应用,以下是演讲的全部PPT内容。

    (更多…)
  • 转载:西电校长杨宗凯走进《中国经济大讲堂》解读信息技术如何翻转课堂

    本文转载自微信公众号:西安电子科技大学

    11月30日晚22时,西安电子科技大学校长杨宗凯受邀走进CCTV2央视财经频道《中国经济大讲堂》“奋斗在科技前沿”栏目,以“信息技术如何‘翻转’课堂”为题,为观众深度解读如何利用信息技术,促进教育融合创新发展。

    央视视频回放地址:
    http://tv.cctv.com/2019/12/02/VIDExp5vgY9AhtdtrK75cSln191202.shtml

    (更多…)
  • 转载:为什么大部分人做不了架构师?这2点是关键

    本文转载自“机器之心·阿里技术”

    原文: https://www.jiqizhixin.com/articles/2019-11-21-9

    阿里妹导读:选择有时候比努力重要,真正厉害的人不仅仅是埋头苦干,而是会利用好的思维方式、好的方法,看穿事物的本质,顺势而为,找到事情的最优解,并懂得举一反三。架构师是程序员的目标之一,但大多数程序员无法成为架构师。真正厉害的架构师具备什么样的思维方式,到底强在哪?今天,韩帅为你揭秘。

    (更多…)
  • 智能医疗再突破:脊柱侧弯智能筛查新系统可达专家水平

    脊柱侧弯是青少年中最常见的脊柱疾病,全世界的患病率为0.5–5.2%。由于传统的筛查方法对于阳性的预测成功率较低,并需要一些不必要的转诊和放射成像。上海交通大学附属新华医院的杨军林教授发现裸露背部外观照能够在一定程度上反应脊柱侧弯程度,因此联合中山大学中山眼科中心的林浩添教授、西安电子科技大学的刘西洋教授着手于脊柱侧弯深度学习筛查技术的研发,项目于2018年获得国家重点研发计划项目(项目编号:2018YFC0116500)。其全球首创脊柱侧弯大规模人工智能筛查系统,准确率可达专家水平,这一成果于2019年10月25日在《自然》子刊《通讯·生物学》(Communications Biology)发表。

    (更多…)

  • 使用N-DenseNet实现城市声音事件分类模型

    现代社会中,智慧城市的构建是一个当前的趋势,其中包括利用传感器网络收集目标城市的城市声音时间的信息采集和分类研究用相关音频数据并进行分析,这对于是提高智能感知水平的重要一步。来自江南大学的一研究团队,通过采用N-DenseNet网络模型,实现了对城市声音事件的分类,其一阶和二阶模型的分类准确率达到了83.63%和81.03%,并且具有良好的泛化能力。

    (更多…)