第066章【能颠覆的不止是搜索引擎】(1 / 2)

会议大厅,罗靖环视众人道:“比如一个问题是对一个小孩解释什么是登入火星,给的回答是一些人去了火星。然后把这些对话内容作为一个数据集,让灵境gpt进行学习,但光是上课不能毕业,想要毕业就得做题、考试。”

罗靖环视众人笑道:“其实就是一个反馈机制,所以我们接下来的任务是要给灵境gpt加上来自人类反馈的强化学习,也就相当于是参加考试。回答错误,重修;回答正确,进一步学习,直到灵境gpt通过考试拿到足够的学分来证明自己的能力。”

回头瞄了眼会议大屏幕并且按了下小遥控器,罗靖条理清晰地说:“具体怎么做呢?还是刚刚的问题举例,给一个小孩解释什么叫登陆火星,让微调过的也就是上完课程的灵境gpt来回答,会生成四個答案,a解释重力、b解释战争、c解释火星是一个天体、d人类去了火星。”

说到这里,罗靖顿了片刻继续说道:“然后就是根据真实、无害、有帮助等若干维度来给这些答案排序、评分,排序结构就是d>c>b=a,之后就是将这些问题和答案以及答案的排序,将这些数据集拿来训练一个奖励模型,训练的目标是让建立模型的评分标准接近人工排序标准。”

“相当于是训练一个ai老师,之后就是最后一步了,通过强化学习来继续训练微调后的灵境gpt,把生成的答案拿去给前面训练好的奖励模型进行打分,根据打分来调整,最终就是灵境gpt生成的答案获得的分数越高越好,一个语言大模型就诞生了。”

罗靖环视在场的工程师们:“随着持续的学习、不断的数据投喂,用海量的数据对灵境gpt进行训练,直到突破某个临界值节点的那一刻,它将表现的越来越像人,以至于一个普通人隔着屏幕跟它聊天的时候甚至都无法察觉对方是个ai。”

接下来,罗靖继续讲述这个语言模型的内核,在场的工程师们直呼开眼,这要是成功了简直不得了。

这就是t1级大神么?

末了,罗靖突然话锋一转,旋即说道:“但灵境gpt的大模型以此开发,还是有它自身的局限性,而且这种局限性是先天注定的。”

与会的工程师们一言不发,一个个都认真的听着,大部分人还在做笔要纪录。

罗靖说道:“要让灵境gpt能够‘读懂’人类的语言是基于统计学规律靠死记硬背,那就意味着它没有接触过的知识是不知道的,比方说投喂给灵境gpt的历史数据知识是截止到21年,那么在21年之后到现在发生的事情它就一概不知,无法生成正确答案。”

众人不由得点了点头。

罗靖接着说道:“这种死记硬背就显得灵境gpt很不灵动,也意味着灵境gpt只有知识而没有常识。再举个例子,比如灵境gpt一本正经的告诉你关羽跟宋江是结拜兄弟,这种人工智障的情况就避免不了。”

在场的人们不禁哄堂一笑。

罗靖接着说道:“要避免这个问题不是没有解决方案,便是从知识图谱着手。以符号的方式,结构化的描述物理世界中的概念及其相互关系,比如‘人有脚’,其中‘人’是主体,‘有’是关系,‘脚’是受体,通过这种方式让灵境gpt拥有常识推理能力。”

“有了知识图谱后,比方说灵境gpt拥有了《三国演义》和《水浒传》里的人物关系图谱,推导之后就能得出关羽和宋江根本就不是结拜兄弟,两者半毛钱关系都没有。”

值得一提的是,知识图谱的研究历史最早可以追溯道上个世纪六十年代,从第一代人工智能符号ai的时候已经开始有人做了,当时对于知识图谱的定义就是“符号ai的逻辑表示”,但构建一个通用型的知识图谱实在太难太难了。

而且知识图谱也有诸多挑战性的问题待解决,比如知识的自动获取、多源知识的自动融合、面向知识的表示学习、知识的推理与应用等等。

举报本章错误( 无需登录 )