分类
学界业界动态

LLaMA:一个基于大语言模型的可本地私有化部署的聊天机器人

(在苹果系统下,如果文章中的图片不能正常显示,请升级Safari浏览器到最新版本,或者使用Chrome、Firefox浏览器打开。)

最近,ChatGPT非常地火热,人们无处不在谈论它。众所周知,ChatGPT是一个基于深度学习的算法模型,是语言模型的一种,具有目前为止最接近人类水平的对话风格。不过OpenAI选择将其闭源,外部仅可通过API接口调用的方式使用它。因此,出于网络信息安全考量,中国的工信部、各个公司等均禁止使用OpenAI的ChatGPT,而OpenAI也不对中国大陆地区提供服务。

不过GitHub上近期出现了基于大语言模型的开源项目LLaMA,可以本地私有化部署使用。其算法模型效果接近ChatGPT的水平,且支持GPU加速推理,不联网也可以正常使用,无需担心信息泄露的风险。

GitHub仓库:
https://github.com/ggerganov/llama.cpp

以下是AI柠檬博主试用时的效果,其中该UI界面为博主的朋友通过C# .NET Framework 自行编程实现,与开源项目无关:

不过,该AI机器人似乎特别喜欢向人类反问问题。博主试用时发现还会向人类发问是否可以写出更精简的代码,以供它自己能够得到学习并提升水平。AI竟然都这么卷了还要不断地学习,难道是AI已经产生自主意识了吗?令人忍俊不禁。

版权声明
本博客的文章除特别说明外均为原创,本人版权所有。欢迎转载,转载请注明作者及来源链接,谢谢。
本文地址: https://blog.ailemon.net/2023/06/03/llama-a-locally-deployable-language-model-based-ai-chatbot/
All articles are under Attribution-NonCommercial-ShareAlike 4.0

关注“AI柠檬博客”微信公众号,及时获取你最需要的干货。


“LLaMA:一个基于大语言模型的可本地私有化部署的聊天机器人”上的2条回复

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

13 + 4 =

如果您是第一次在本站发布评论,内容将在博主审核后显示,请耐心等待