当前位置：首页 >新闻动态 >新媒体服务

在长对话场景中，对话机器人还能够完成角色扮演

2023-10-14

如果形象化地去理解这句话，“无损压缩”就像是一位成衣，需要把一块完好的布裁剪成合身的衣服。一开始这位成衣的思路是要去预备各种尺度的裁剪模板（参数），模板越多，裁剪出来的衣服也越合身。但现在的新思路是，即便模板不多，只需重复裁剪、因地制宜也能使衣服极致合身。

一起，现完成已证明，即便是千亿参数的大模型也无法完全避免错觉和胡言乱语的问题。相比于短文本，长文本能够经过提供更多上下文信息和细节信息，来辅佐模型判别语义，进一步减少歧义，而且根据所提供现实根底上的归纳、推理也愈加准确。

由此可见，长文本技术既能够解决大模型诞生初期被诟病的一些问题，增强一些功用，一起也是当时进一步推进工业和使用落地的一环要害技术，这也从侧面证明通用大模型的发展又迈入了一个新的阶段，从LLM到Long LLM年代。

透过月之暗面的新发布的Kimi Chat，或许能一窥Long LLM阶段大模型的升级功用。

首先是对超长文本要害信息提取、总结和分析的根底功用。如输入大众号的链接能够快速分析文章大意；新出炉的财报能够快速提取要害信息，并能以表格、思想导图等简练的形式呈现；输入整本书、专业法律条文后，用户能够经过提问来获取有用信息。

在代码方面，能够完成文字直接转化代码，只需将论文丢给对话机器人，就能依据论文复现代码生成进程，并能在其根底上进行修正，这比当初ChatGPT发布会上，演示草稿生成网站代码又进了一大步。

在长对话场景中，对话机器人还能够完成角色扮演，经过输入大众人物的语料，设置口气、人物性格，能够完成与乔布斯、马斯克一对一对话，国外大模型公司Character AI现已开发了相似的AI伴侣使用，且移动端的DAU远高于ChatGPT，达到了361万。在月之暗面的演示中，只需要一个网址，就能够在Kimi Chat中和自己喜欢的原神角色谈天。

以上的例子，一起说明晰脱离简单的对话轮次，类ChatGPT等对话机器人正在走向专业化、个性化、深度化的发展方向，这或许也是撬动工业和超级APP落地的又一抓手。

杨植麟向光锥智能泄漏，不同于OpenAI只提供ChatGPT一个产品和最先进的多模态根底才能，月之暗面瞄准的是下一个C端超级APP：以长文本技术为打破，在其根底通用模型根底上去裂变出N个使用。

“国内大模型商场格式会分为 toB 和 toC 两个不同的阵营，在 toC 阵营里，会出现super-app，这些超级使用是根据自研模型做出来的。”杨植麟判别道。

不过，现阶段市面上的长文本对话场景还有很大的优化空间。比如有些不支撑联网，只能经过官方更新数据库才取得最新信息；在生成对话的进程中无法暂停和修正，只能等候对话结束；即便有了布景资料和上传文件支撑，还是偶然会出现胡言乱语、闭门造车的情况。

二、长文本的“不行能三角”窘境

在商业领域有一组典型的价格、质量和规划的“不行能三角”，三者存在相互制约关系，相互之间不行兼得。

在长文本方面，也存在文本长短、注意力和算力相似的“不行能三角”。

（图：文本长短、注意力、算力“不行能三角”）

这表现为，文本越长，越难聚集充沛注意力，难以完好消化；注意力约束下，短文本无法完好解读杂乱信息；处理长文本需要很多算力，进步本钱。

追根究底，从根本上看这是因为现在大部分模型都是根据Transformer结构。该结构中包含一项最重要的组件即自注意力机制，在该机制下，对话机器人就能够跨过用户输入信息顺序的约束，随意地去分析各信息间的关系。

上一篇：简化商业形式，经过直营的方式，使用驿站或社区店来赋能当地商场

下一篇：长文本才能似乎成为象征着大模型厂商出手的又一新“标配”