随着AI技术的快速发展,大型语言模型(LLM)与外部数据源和工具的交互需求日益迫切。在最初的提示词工程阶段,我们可能会人工编写、从数据库中筛选或者使用工具检索可能需要的信息,再手动粘贴到提示词 prompt 中。随着我们要解决的问题越来越复杂,手工把信息引入到 prompt 中会变得越来越困难[1]。
此时,如AI柠檬博主上一篇博客文章提到的 Function Call 便被引入了进来。该机制允许大模型在需要时调用用户预先定义的函数来获取数据或执行操作,显著提升了自动化水平。而这一过程本质上是由大模型输出一个json格式内容,在字段指定参数值中告诉你应该调用什么函数,以及传入什么函数入参来实现。
但工具函数调用这种传统API接口存在局限性,如兼容性差、安全隐患等,进而催生了模型上下文协议(Model Context Protocol, MCP)的诞生。这项由Anthropic公司于2024年11月推出的开放标准,被誉为“AI领域的USB-C接口”,旨在为AI应用与外部资源提供统一的通信框架[2]。
(更多…)