发展AI技术 俄公司推出ChatGPT竞品

2024年3月21日
【 字号:
【《透视俄罗斯》消息 】俄罗斯VK公司开发出自己的文本生成式大型语言模型(LLM),训练基础包括在VK开放小组中的讨论。第一批生成功能正在Mail.ru邮箱和日历工具中测试。Yandex也在研究使用神经网络问题。VK除面向个人用户的Mail.ru服务外,还在开发面向公共部门的单独产品。专家认为,工作任务自动化比在社交媒体中添加神经网络功能更有前景。
A view of the VK Russian internet company stand at the 2022 St Petersburg International Economic Forum, 2022
来源:Kirill Kuhmar/塔斯社
http://tsrus.cn/679737

扫一扫

开发成果

据VK公司消息,该公司创建了自己的LLM,并使用“互联网文本开放语料库和VK社交网络中的公共数据”进行训练,后者是指开发小组中的帖子和评论。Yandex和储蓄集团(Sber)也开发了自己的LLM(YandexGPT和GigaChat),并将其嵌入自己的B2C产品,同时向第三方开发者开放生成结果。MTS也有自己的LLM(MTS AI)。1月25日开始,MTS AI由安德烈·加里宁领导。他此前担任VK人工智能(AI)副总裁至2023年9月。一位知情消息人士说,VK语音助理玛鲁夏开发团队“与Mail.ru团队几乎完全重叠”。目前,VK人工智能副总裁由Dzen总经理安东·弗罗洛夫兼任。

VK代表说,常规任务“应合理分类”,因此神经网络功能正在Mail.ru生产力工具中测试。这一类别中,除企业聊天工具“VK Teams”外,VK还在根据与俄数字发展部签订的国家合同,开发一个公务员自动工作站(ARM GS),其将整合邮箱、聊天、云存储和内联网等服务。该公司表示,使用LLM的进一步决定,将根据在Mail.ru产品中的测试结果作出。Yandex360(整合了类似服务,其中也包括邮箱)宣布,他们也在“努力将社交网络嵌入产品”。咨询公司Axenix高级分析师、AI专家克里库诺夫(Vasily Krikunov)说,对VK来说将这项技术嵌入生产力工具很有意义,因为“社交媒体中节省大量内容创建时间的场景并不多”。他说:“社交媒体中易于使用的内容已占据主导地位。”

主要前景

技术上说,VK能吸引足够算力训练LLM。人工智能开发公司Just AI的自然语言处理专家萨维奥洛娃(Alina Savelova)说,基础LLM可以通过两种方式创建:像Yandex和储蓄集团一样从零开始,或通过对第三方开源代码模型进行补充训练。她说:“第一种情况需要巨大算力、强大的团队和相当长的时间,至少半年甚至一年。第二种情况要求较低,但质量具有可比性。”她认为,可利用社交网络内容进行训练,但“只用这些内容训练没有意义,公司将不得不吸引标记者”。该专家认为,长远看VK开发自己的模型而不是利用公开源是明智的。“自由金融”投资公司专家说:“人工智能的发展在现代世界中发挥着关键作用,对各生活领域至关重要。AI能解决复杂任务,提高不同过程的效率,为社会发展创造新机遇。医学领域AI有助于诊断疾病,预测治疗效果,提高医疗服务质量。医疗分析和医疗数据处理过程自动化能缩短诊断时间,提高诊断结果准确性。商业领域AI可优化管理流程。”

另一家俄罗斯公司MTS AI开发了一个面向企业客户的大型语言模型,如用于创建文件和通话的摘要。该模型只支持文本需求,但公司正开发用于生成照片、视频和代码的模型。市场参与者认为,语言模型还可以在MTS的B2C产品领域找到应用。他们推测MTS开发模型时使用了集团其他部门收集的数据。MTS公司称,其在人工智能领域的子公司MTS AI开发了一个大型语言模型MTS AI Chat,面向企业客户,应用场景包括制订职务细则、从文档中提取信息、编写通话摘要,等等。该项目将按客户设备本地部署(On-Premise)模式推广,至于其对公众开放的时间,“MTS AI将另行发布”。2023年7月,MTS在招聘网站HH.ru发布招聘数据研究员信息,“培训MTS-ruGPT和MTS-ChatGPT模型”用于企业客户。该职位空缺已删除,根据其描述,第二个模型“支持图像和视频”。MTS宣布,MTS AI Chat支持文本需求,但公司正开发“一款能识别视频和图像的独立产品”。此外,公司还在开发代码生成和自动补丁工具。俄储蓄集团2023年推出抢先体验模式类似产品GigaCode。Yandex和俄罗斯电信公司也进行这方面的开发。

根据“雅科夫及合作伙伴”咨询公司和Yandex去年12月公布的一项联合调查结果,20%的俄罗斯大公司已在使用生成式AI,基础技术有OpenAI(俄罗斯无正式访问权)、YandexGPT(用于生成文本)和储蓄集团Kandinsky(用于生成图像)。人工智能联盟(包括Yandex、VK、MTS、俄气石油等公司)宣布,大型语言模型的推广将对“农业、卫生、工业、运输和建筑等行业”产生重大影响。咨询公司Axenix的“数据和实用AI”实践总监马利科娃(Larisa Malkova)说,MTS创建语言模型时,可能使用了集团其他部门收集的匿名数据。她说,在不访问该产品的情况下无法评估其竞争力。马利科娃认为,根据一般规则,AI产品在用户企业的成功取决于多个因素。她说:“首先,开发公司必须能自主进行基础研究;其次,预测客户的具体需求;第三,帮助客户克服应用障碍。”她认为,没有一个开发公司全面提供这些服务。Just AI公司业务发展总监扎哈罗娃(Svetlana Zakharova)认为,企业环境中的使用,数据保密性和设备要求也很重要。她说:“客户必须知道,维护模型需要多少硬件。”

Yandex和俄储蓄集团AI产品被嵌入公司的B2C和B2B产品中。扎哈罗娃说,MTS将来也会将基础技术集成到自己的个人消费项目(B2C)中,这些项目有“现成客户和可测试技术受众”。但她认为,MTS AI Chat的第一批B2C应用将是有限的。她说:“我认为,MTS将从MVP开始,观察目标受众反应,并对模型进行补充训练。”

本文为《透视俄罗斯》专稿

 | www.tsrus.cn/679737|  

安娜·库兹涅佐娃(Anna Kuznetsova)

《透视俄罗斯》网站及其所有方《俄罗斯报》拥有网页发布所有信息和资讯的完全版权。未经过《透视俄罗斯》网站编辑书面同意禁止转载。联系邮箱:info@tsrus.cn