HI,下午好,新媒易不收取任何费用,公益非盈利机构
24小时服务热线: 4000-163-302
请扫码咨询

新闻动态

NEWS CENTER

在长对话场景中,对话机器人还能够完成角色扮演

2023-10-14

如果形象化地去理解这句话,“无损压缩”就像是一位成衣,需要把一块完好的布裁剪成合身的衣服。一开始这位成衣的思路是要去预备各种尺度的裁剪模板(参数),模板越多,裁剪出来的衣服也越合身。但现在的新思路是,即便模板不多,只需重复裁剪、因地制宜也能使衣服极致合身。

一起,现完成已证明,即便是千亿参数的大模型也无法完全避免错觉和胡言乱语的问题。相比于短文本,长文本能够经过提供更多上下文信息和细节信息,来辅佐模型判别语义,进一步减少歧义,而且根据所提供现实根底上的归纳、推理也愈加准确。

由此可见,长文本技术既能够解决大模型诞生初期被诟病的一些问题,增强一些功用,一起也是当时进一步推进工业和使用落地的一环要害技术,这也从侧面证明通用大模型的发展又迈入了一个新的阶段,从LLM到Long LLM年代。

透过月之暗面的新发布的Kimi Chat,或许能一窥Long LLM阶段大模型的升级功用。

首先是对超长文本要害信息提取、总结和分析的根底功用。如输入大众号的链接能够快速分析文章大意;新出炉的财报能够快速提取要害信息,并能以表格、思想导图等简练的形式呈现;输入整本书、专业法律条文后,用户能够经过提问来获取有用信息。


在代码方面,能够完成文字直接转化代码,只需将论文丢给对话机器人,就能依据论文复现代码生成进程,并能在其根底上进行修正,这比当初ChatGPT发布会上,演示草稿生成网站代码又进了一大步。


在长对话场景中,对话机器人还能够完成角色扮演,经过输入大众人物的语料,设置口气、人物性格,能够完成与乔布斯、马斯克一对一对话,国外大模型公司Character AI现已开发了相似的AI伴侣使用,且移动端的DAU远高于ChatGPT,达到了361万。在月之暗面的演示中,只需要一个网址,就能够在Kimi Chat中和自己喜欢的原神角色谈天。


以上的例子,一起说明晰脱离简单的对话轮次,类ChatGPT等对话机器人正在走向专业化、个性化、深度化的发展方向,这或许也是撬动工业和超级APP落地的又一抓手。

杨植麟向光锥智能泄漏,不同于OpenAI只提供ChatGPT一个产品和最先进的多模态根底才能,月之暗面瞄准的是下一个C端超级APP:以长文本技术为打破,在其根底通用模型根底上去裂变出N个使用。

“国内大模型商场格式会分为 toB 和 toC 两个不同的阵营,在 toC 阵营里,会出现super-app,这些超级使用是根据自研模型做出来的。”杨植麟判别道。

不过,现阶段市面上的长文本对话场景还有很大的优化空间。比如有些不支撑联网,只能经过官方更新数据库才取得最新信息;在生成对话的进程中无法暂停和修正,只能等候对话结束;即便有了布景资料和上传文件支撑,还是偶然会出现胡言乱语、闭门造车的情况。

二、长文本的“不行能三角”窘境

在商业领域有一组典型的价格、质量和规划的“不行能三角”,三者存在相互制约关系,相互之间不行兼得。

在长文本方面,也存在文本长短、注意力和算力相似的“不行能三角”。


(图:文本长短、注意力、算力“不行能三角”)

这表现为,文本越长,越难聚集充沛注意力,难以完好消化;注意力约束下,短文本无法完好解读杂乱信息;处理长文本需要很多算力,进步本钱。

追根究底,从根本上看这是因为现在大部分模型都是根据Transformer结构。该结构中包含一项最重要的组件即自注意力机制,在该机制下,对话机器人就能够跨过用户输入信息顺序的约束,随意地去分析各信息间的关系。

相关推荐