引言
我之前帮助很多同学检查他们用AI写作的质量问题,我发现有很多问题的根本是对大语言模型的基本原理不理解,导致使用AI的时候犯一些低级错误。
如果你只是把AI当一个聊天机器人,那可以随便聊。但如果要把它当成是强大的生产力工具,那就必须得了解清楚其原理,这样才能把它的能力发挥到极致。
最主要的是,了解原理能够让你明白AI的能力边界,避免让AI做出超出它能力的事情,从而避免犯低级错误。这很重要。
大语言模型原理
什么是大语言模型
我们写作用的AI属于大语言模型(LLM,Large Language Model),它是AI的一种类型。AI也就是人工智能,它的类型有很多:下围棋的AlphaGo是AI,人脸识别是AI,抖音推荐算法是AI,AI画图也是AI。这些AI都不属于大语言模型。我们写作用的ChatGPT、Claude、Kimi、通义千问这些属于大语言模型。
大语言模型,顾名思义,它是处理自然语言的(自然语言指的是人类从自然界演化出来的语言,也就是我们平时说的语言,它是相对机器语言、形式逻辑语言这些人类发明出来的语言的)。它是使用海量的文字,准确地说是互联网上能搜集到的所有文字,训练出来的,所以叫大模型(准确地说这个“大”是指参数多,但这里就不展开说什么叫参数了)。
GPT(Generative Pretrained Transformer)是一种大语言模型的算法,由于ChatGPT的成功,现在的大语言模型99%都是用的这个算法。其实大语言模型还有别的算法,比如BERT,只是效果不太好,所以没有普及。
大语言模型是怎么输出的
大语言模型能够写出来文字,本质上不是因为它真的会思考,而是因为它会“猜”。它的工作原理其实非常简单,就是用全互联网上所有能搜集到的文字把它训练一遍,然后当你跟它说话的时候,它就能猜出来下一个字要说啥。也就是说,它的底层本质是概率和统计。
声明:
1、本站资源针对会员完全免费,站点中所有资源大部分为投稿作者付费教程,切勿轻易添加教程上除本站信息外的任何联系方式,谨防被割,如有疑问请随时联系客服。
2、本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
1、本站资源针对会员完全免费,站点中所有资源大部分为投稿作者付费教程,切勿轻易添加教程上除本站信息外的任何联系方式,谨防被割,如有疑问请随时联系客服。
2、本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。