发布时间:2023-03-20 20:46:39
阅读量:1041
标签:
容联云刘杰:ChatGPT引入了强化学习机制。它不仅仅像以前的大模型,利用了没有人工标注的数据去学习,还在新版本上引入了人工标注的数据,通过人类的反馈,有针对性地进行优化。这是ChatGPT一个重要的进展,给了我们很大的启发。
ChatGPT是一个黑盒计算,当下在内容的可信性和可控性上有一定局限。我们要给它足够正确的知识,再引入知识图谱这类知识管理和信息注入技术,还要限定它的数据范围和应用场景,使得它生成的内容更为可靠,这是我们在做的。
从模型的规模来看,ChatGPT的优势是它的大带来的,但在应用落地上,由于它过大,也带来了挑战和局限。脱离场景去谈大和小是没有意义的。在特定应用场景、特定条件约束下、在特定的数据上,去训练规模适宜的模型,是我们努力的目标。
AI是一个链条比较长的产品技术,如果没有建立一个好的反馈机制,在部署运营阶段,从最前线发现的问题,就很难有效定位解决,所以要让模型去持续成长和优化。它不是静态的,不是交付了就不再管它。
在对企业的落地方面,ChatGPT这类大模型,也有典型的问题。首先,很多客户有私有化部署要求,但这些模型非常大,对资源要求高,当前不太可能实现私有化部署。其次,这些大模型在一些特定行业或特定任务上,专业性是欠缺的,需要去适配。而对于ChatGPT这类非开源的大模型应用来说,对它在下游任务上的微调,如何兼顾成本、灵活性和数据隐私则是一个关键问题。这些问题也造成,这种模型还没有走到服务企业级客户,尤其是大型企业客户那一步。
21世纪商业评论:如何评价ChatGPT,其出现为什么能引发这么高的关注度?它在技术上最关键的改进是什么?
容联云刘杰:首先,ChatGPT不再是通过某一个单一的任务,调用某一个对应的模型去解决问题,所以大家认为这是一个非常有前景的路径去做一个通用的AI模型, 这让大家非常振奋和抱有期待。
其次,ChatGPT在能力的表现上是非常卓越的,无论是对用户的语言理解,还是自身语言的生成表达能力、对复杂问题的认知和推理能力,都是以前模型所不具备的水,这也是一个引人关注的亮点。
最后,ChatGPT完成很多复杂的任务,但是这个过程中和用户的交互是非常自然和开放的,基本上就是通过自然语言的对话完成各种任务,只需要告诉它做什么,把相应信息给到它就可以完成相应的任务,这是非常具有开放性,交互自然的应用形式,这也是C端普通用户感到ChatGPT非常吸引人的重要原因。
21世纪商业评论:现阶段ChatGPT存在的局限性/改进空间,比如数据局限性、真假答案混杂等?向GPT4等更高等级的进化方向?
容联云刘杰:当前大家在技术、应用场景可能比较关注的点, 包括刚才说的知识动态更新变化等等,其实这个本身解决起来不是很简单的事情,ChatGPT本质是一个黑盒的深度神经网络的模型,无论是内部和外部研发人员,都不是很容易进行精准的修改和调整,这是一个很系统关联的工程,只能通过某些技术手段尽量调优它。
关于成本与产业化路径
数智前线:ChatGPT或类似产品的产业化机会?
容联云刘杰:ChatGPT主要的产业化路径,目前可能性比较大的首先还是在C端。由于ChatGPT展现出的大模型的创造性,以及对长篇上下文的理解能力,它可能会聚焦于一些开放性、创意性和通用性的任务上。
21世纪商业评论:ChatGPT的算力成本有多高,打造这样一个系统、维持它的运营有多昂贵?
容联云刘杰:包括ChatGPT这种超级模型,其实终归成本是两部分,第一是模型训练成本,工作人员持续优化调整,这部分是大家看不到的很大的成本,这里面除了算力还有人工标注成本;另外一个就是在线推理/生成的计算成本。像ChatGPT这种模式是服务更多的客户,通过大量的客户应用来平摊固定成本。
21世纪商业评论:长期来看,ChatGPT的推出,对搜索引擎的格局会带来颠覆式的影响吗?该技术的商业化落地,会按怎样的产业化路径来走?
容联云刘杰:搜索引擎最初解决用户的需求是,在互联网阶段,海量信息导致用户信息过载,用户找不到想要的信息,就通过搜索引擎相关的算法,给用户查询网页反馈一个相关列表,也就是信息获取的需求。
这种信息获取的需求分为两类,一类是就想知道特定答案,搜索引擎根据相关的信息搜集给用户网页列表,让用户自己在里面去找,但其实用户想要的是答案不是列表,从这个层面上来讲,ChatGPT以问答形式给到答案的服务才是真正一步到位的服务,当然前提是ChatGPT解决了现有的局限,能够实时动态快速把新的信息汇总起来,给到用户才行。不过目前来说ChatGPT还是静态的,无法达到要求。
第二类就是用户需要的不是某个单一的答案,而是需要做广泛调研和信息收集,通过多样化的查询收集信息并做自主的筛选,这时候搜索引擎类型的服务其实更合适,当然这也不排除ChatGPT通过用户多轮问答等方法来解决这类问题。
当下,我们作为用户已经非常适应搜索引擎的功能体验了,从这点出发,ChatGPT这类服务无论在技术、还是产品形态上还是要做进一步的探索。
21世纪商业评论:一些观点提到,国内没有诞生ChatGPT这种实验室产品的土壤,国内AI厂商与ChatGPT的产品差距至少在2年以上,如何看待这些观点,中国公司和海外在这项技术上的差距?诞生在硅谷的ChatGPT,给中国科技企业带来哪些启发/反思?
容联云刘杰:我觉得这个事情,不一定非得站在国内外反差角度上来分析。而是应该从纯技术的发展角度上来看,技术的研发和演进应该是百花齐放的。所有的技术方法,在不同时期,不同阶段所处地位不一样,都是有其合理性和阶段性价值的,可能不同技术在不同阶段各领风骚,但在未来某段时间,这些技术有可能是互补和融合的,大家从不同路径走到共同的终点,都是有可能的。
如果从国外来看,我们看到了OpenAI在ChatGPT上的成功,但其实在这件事情上,很多国外AI领域代表性公司包括DeepMind、谷歌、Meta等,早期也是有类似的大规模模型的,但是今天只有OpenAI用合理的技术方案和坚定的决心走到了一个新的里程碑阶段。所以不只是国内国外某一家公司需要反思的,大家都是在不同的路径上前行,各自努力去探索。
另外,OpenAI在这件事上取得成功,肯定是我们学习和思考的,站在国内技术发展角度,除了应用层面一些研究和商业化,也不能忽视基础技术的研发和投入,这种投入大、周期长,对企业都是比较大挑战。 这就需要我们要保持比较好的战略眼光,对有价值有挑战的事情,坚持去做,去推进。
最后,我觉得有一点值得思考的是,我们经常感觉,基础性的理论技术研究,它离应用会比较远,但是现在我们看到,很多时候越是基础的研究才会带来颠覆性发展和超越,也恰恰是ChatGPT为代表的方法技术,因其基础性,反而更容易获得广泛的应用前景。
小规模的预训练模型与TO B行业赛道
虎嗅:相比于ChatGPT这样大规模的模型,很多小规模的预训练模型在人机对话领域中的商业应用如何?
容联云刘杰:To B行业对人工智能要求更严肃、严谨,目前的人机对话内容主要集中在客服、语音、营销等领域,需要充分考虑行业特性和业务知识,利用针对性设计和训练的轻量预训练模型更适合满足当前IT基础设施条件下的客户在AI应用上的需求。
21世纪商业评论:容联云是否有在研发与ChatGPT类似的技术,是否有可优先落地的场景?
容联云刘杰:和ChatGPT相关的技术,比如内容生成等,本身我们容联一直在做相关的技术研发,当然在规模上,可能不是像ChatGPT这种超大的规模,这种超大的规模在我们这个应用场景中不是特别适合给客户部署应用。所以我们更多的也是思考和关注,研发如何把这种大模型的通用能力和特定行业专业场景下垂直能力快捷方便地进行融合,形成我们在特定领域的规模适宜性能优秀的AI产品。
咨询热线
400-775-5500
客服在线时间
9:00-18:00
(其他时间为机器人客服)