时下科技领域最热的概念莫过于ChatGPT。
2月20日,复旦大学邱锡鹏团队推出中国版ChatGPT“MOSS”,这是国内第一个公布的对话式大型语言模型,热情的用户涌入一度导致其服务器被挤崩。
(资料图)
21日晚,第一财经连麦学界、法律界大V,共同探讨了ChatGPT的应用、误读以及其牵涉的法律风险和商业伦理问题。
复旦大学计算机科学技术学院教授张奇参与了本次讨论,他正是推出MOSS的复旦大学NLP实验室的核心成员之一,就当下所面临的一些争议,他表示MOSS并不代表国内最好的模型,团队只是想在学术上进行数据收集,进入更详细的探讨。
作为专业研究者,张奇复现了ChatGPT 推出背后所需要投入的资源,这是一个非常耗时、耗人且耗钱的一个过程。他表示,这不仅对于学术界来说是不小的投入,甚至对于互联网大厂来说,做这类研究都是一个不小的投入。
MOSS迈出第一步
相对于ChatGPT,MOSS仍然有非常大的差别,在直播中,张奇直言,“ChatGPT是千亿级的模型,我们只有百亿级。此外在指定微调的阶段ChatGPT并没有公开,但是能够看到的版本已经有1800种任务,团队只有数百种任务,规模上远远小于它。”
张奇所在的复旦团队从整体上复现了ChatGPT的步骤,他解释道,语言模型的最后一步需要人的参与,如果没有用户的真实数据,团队很难对模型进行提升,也很难再进行下一步的研究。这也是MOSS推出的背景。
推出当时团队并没有考虑太多,随后而来的热度和争议也是团队没有想到的,“我们低估了ChatGPT和MOSS的影响力。”
面临争议,2月21日,复旦团队在MOSS官网发布公告致歉,称模型还不成熟,距离ChatGPT还有很长的路需要走,“我们一个学术研究的实验室无法做出和ChatGPT能力相近的模型,MOSS只是想在百亿规模参数上探索和验证 ChatGPT的技术路线,并且实现各种对话能力。”
对于ChatGPT 背后模型所拥有的1750亿的参数规模,张奇表示,学校这类机构很难去完成,目前百亿级的规模都已经非常困难。
按照ChatGPT目前开源的最简单的复现版本、最便宜的模式去计算,要做到1750亿的参数规模,需要大概6000万的硬件成本,同时运算3年5个月。这还是所有事情都做对的情况,如中间有参数调整,或者想加速训练过程,就需要更高规模的投资。
按ChatGPT的规模估算,张奇判断OpenAI大概为此耗费了十几亿的硬件投资,不包括顶级的算法研究人员的投资,以及后续对大量用户数据收集的投资。
“这其实是一个非常耗时、耗人且耗钱的一个过程。”不仅对于学术界来说是不小的投入,甚至对于互联网大厂来说都是一个不小的投入。
因此,在资金、算力的投入门槛下,面临应用场景和商业化的不确定性,团队和企业敢不敢去做这类研究,每一步都制约着在这个领域的进步。
尽管当下面临很多问题,张奇所在的实验室对于ChatGPT所带来的通用人工智能的可能性仍充满期待。
“实验室很多同学都已经是997,我们大概8点就已经到办公室,晚上10点才回家。这种状态就像我们看到了莱特兄弟的飞机飞10米的那个状态,然后我们想把它飞到100米,去实现那样的可能性。”
ChatGPT被过誉了吗
ChatGPT的能力到底如何?张奇团队对此做了一个针对ChatGPT的高考测试,发现其展现了很好的理解和推理能力。
以2022年的高考全国卷为例,在把一些复杂的问题排除掉后,ChatGPT可以达到76%的准确率和67%的得分率,在文科上能够达到78%的得分率。综合来看,ChatGPT在高考中可以获得500分左右的成绩,相当于是二本线的一个结果。
但就目前ChatGPT所引起的追捧来看,它是否被过誉了?上海大邦律师事务所高级合伙人游云庭提到,自己是国内较早使用ChatGPT的用户,但用了两天就失去兴趣,因为现有的互联网对他这类成熟网民来说仍然是更好的选择。
游云庭并不认为ChatGPT可以颠覆搜索,ChatGPT更多偏向于咨询,和搜索引擎是两类产品,且主流用户已经适应了搜索引擎,以目前ChatGPT所展现的能力还无法替代。
此外,ChatGPT还需要很长的时间去开发进行二次落地,“像VR、元宇宙这些概念提出来之时都很热,但现在都相对平静了,因为这些技术的开发实际上都需要很长的时间,这是误导性的问题。”游云庭表示。
复旦大学管理学院助理教授李文文还提到,目前大众的一个误区是对ChatGPT取代人类的工作的担忧,现在网上一些文章或者短视频,用一些或许比较夸张的标题营造了一些恐慌,对于不了解AI产品或是技术的人,甚至会对技术产生消极的情绪。
但实际上,就现阶段的ChatGPT而言,它仍然是一个对话型的AI产品,距离商业落地有比较长的路要走。在试用ChatGPT的时候也会发现它其实存在一些事实性的错误。
如果仅仅把ChatGPT当做娱乐向的产品,错误是可以接受的,但如果要将它应用在企业的业务,如医疗健康、法律领域,它会产生一些严重的后果。
基于此,李文文认为ChatGPT并不会对人类的工作造成太大威胁,未来可能更多是人工智能产品被引入到更多的行业,去辅助而不是取代我们的工作。
作为一名律师,游云庭也提到,作为一个工具,ChatGPT确实能够一定程度提高效率,但并不会对法律行业造成挑战。
“我试着用ChatGPT生成一份合同,给它设定一个任务,给了一些条件,这份合同出来之后我松了一口气,我的职业看起来是比较难取代的。”游云庭提到,在ChatGPT的合同中,有一些逻辑上的错误,前后仍然有一些矛盾,还需要很多的细调。但仅仅是这样的细调,在人工智能领域或许就需要耗时不短的时间,才能达到对于商业化的要求。
在诉讼方面,美国一家企业已经开发了一个人工智能律师,一定程度上的确可以取代律师的工作,但法律服务在所有国家都是有壁垒的,包括律师的牌照。而是否允许人工智能参与到法律服务中,还涉及到人工智能的伦理问题。
“在这些问题没有搞清楚之前,我相信任何一个国家的律师主管部门,都不会轻易给人工智能发牌照。从诉讼的角度来说类似ChatGPT的一些应用,要挑战律师饭碗也挺难。”游云庭说。
上周,终端库存高企,日韩对澳煤需求继续保持低迷,欧洲地区天然气库存高位且煤炭现货供应较为充足,抑制终端采购兴趣,澳大利亚动力煤价更多
2023-02-21 16:15:15中国铁路太原局集团有限公司介绍称,春运40天累计完成发送煤炭72816万吨,同比增12%,旅客发送量同比增长187%。 为确保春运期间电煤等更多
2023-02-21 10:14:28煤炭库存高企,叠加市场需求低迷,煤炭价格在连续17天下跌后,市场迎来前期观望等待的需求以及部分抄底需求的释放。在诸多因素影响下,短更多
2023-02-21 10:13:19近日,国家矿山安监局江西局会同江西省应急管理厅联合下发通知,对煤矿技术管理事项审批工作提出规范要求。 一是明确煤矿安全领域各层更多
2023-02-21 10:02:18全球性的去煤行动是否已经开始尚有待商榷,各国的去煤进程实际上并不同步。 根据2022年末国际能源署(IEA)发布的年度煤炭市场报告,全更多
2023-02-21 09:58:07上周市场情况综述 产地方面,上周大幅回落。主产地日产量已高于年前正常水平,而下水煤需求低迷,地销也阶段性陷入停滞。随着大集团委更多
2023-02-21 09:55:142月20日,国家发改委等部门发布《关于做好2023年春耕化肥保供稳价工作的通知》(以下简称《通知》)。 《通知》指出,煤炭供应企业、化更多
2023-02-20 16:09:47据湖南省商务厅对全省生产资料流通市场监测数据显示,2023年第7周(2月6日-12日),湖南省煤炭销售均价123608元吨,下跌06%,同比上涨16%更多
2023-02-20 09:55:24据商务部重要生产资料市场监测系统数据显示:2月4日-2月10日,从监测品种样本数据来看煤炭平均价格为8396元吨,与前一周比(下称环比)下更多
2023-02-20 09:58:04按照国家矿山安全监察局统一安排部署,山西省将聚焦重点产煤县和煤矿企业开展督导整治,进一步夯实重点县煤矿安全生产属地监管责任和重点更多
2023-02-20 10:15:30