引言

我之前帮助很多同学检查他们用AI写作的质量问题，我发现有很多问题的根本是对大语言模型的基本原理不理解，导致使用AI的时候犯一些低级错误。

如果你只是把AI当一个聊天机器人，那可以随便聊。但如果要把它当成是强大的生产力工具，那就必须得了解清楚其原理，这样才能把它的能力发挥到极致。

最主要的是，了解原理能够让你明白AI的能力边界，避免让AI做出超出它能力的事情，从而避免犯低级错误。这很重要。

大语言模型原理

什么是大语言模型

我们写作用的AI属于大语言模型（LLM，Large Language Model），它是AI的一种类型。AI也就是人工智能，它的类型有很多：下围棋的AlphaGo是AI，人脸识别是AI，抖音推荐算法是AI，AI画图也是AI。这些AI都不属于大语言模型。我们写作用的ChatGPT、Claude、Kimi、通义千问这些属于大语言模型。

大语言模型，顾名思义，它是处理自然语言的（自然语言指的是人类从自然界演化出来的语言，也就是我们平时说的语言，它是相对机器语言、形式逻辑语言这些人类发明出来的语言的）。它是使用海量的文字，准确地说是互联网上能搜集到的所有文字，训练出来的，所以叫大模型（准确地说这个“大”是指参数多，但这里就不展开说什么叫参数了）。

GPT（Generative Pretrained Transformer）是一种大语言模型的算法，由于ChatGPT的成功，现在的大语言模型99%都是用的这个算法。其实大语言模型还有别的算法，比如BERT，只是效果不太好，所以没有普及。

大语言模型是怎么输出的

大语言模型能够写出来文字，本质上不是因为它真的会思考，而是因为它会“猜”。它的工作原理其实非常简单，就是用全互联网上所有能搜集到的文字把它训练一遍，然后当你跟它说话的时候，它就能猜出来下一个字要说啥。也就是说，它的底层本质是概率和统计。

声明：
1、本站资源针对会员完全免费，站点中所有资源大部分为投稿作者付费教程，切勿轻易添加教程上除本站信息外的任何联系方式，谨防被割，如有疑问请随时联系客服。
2、本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。