最近关于ChatGPT的火爆已经不是简单的AI圈的事了,它已经席卷了所有的IT、媒体圈子,甚至是不同领域不同行业的人,只要你还对于变化与AI有一定的了解,那我相信你一定能知道ChatGPT是什么了。ChatGPT在某种程度上已经是相当于AGI通用人工智能的代名词了。
但是国内的ChatGPT怎么样了呢?最近我们能看到的一些消息吧。
百度:文心一言
阿里:传说已经在准备了,达摩院的
小冰:尽管脱胎于微软,但是它的对话智能主要是来源于规则,并不是ChatGPT这种LLM
腾讯:我们有相关研究,正在稳步推进中
京东:我们已经上线了“言犀”
360: 已经达到了GPT2.0略好一点儿的水平,但是已经准备全力杀入这个赛道,股价连涨了大概三天吧
奇安信:尽管我没听过,但是不妨碍人家在安全领域里已经开始研究ChatGPT的应用
网易有道:已经在使用类似的ChatGPT在垂直方向,像口语,作文批改
科大讯飞:计划将类ChatGPT应用到教育产品
知乎:Bing里有大量来自于知乎的回答,所以知乎是有希望发展的,于是也涨了
四维图新:参股公司有类似ChatGPT的东西
字节跳动:明确表示没有跟ChatGPT有关系
Glow:没听过,传说有平替
尽管大家有了一些类似的产品,但是在我看来有能力,有财力,有数据能完成媲美ChatGPT的产品,可能大概率是这几家公司:百度、腾讯、字节、阿里、
这几家里都有一个明显的特征,曾经或者说现在的互联网头部企业,有钱,同时有大量的数据。如果再加上可能的互联网爬取数据方式,那只差一个问题,怎么用这些数据。
如果说创新是极难的,那么仿造在AI领域,可能并不太难,只是一个投入与试错的问题。当然了在国内,我们可能要跨过这几道关口还是有点麻烦的。
钱:按OpenAI给出的一些信息我们估算,做一次完整的训练,可能需要大概1000万美金,如果真的是这样,国内差不多就是亿级的试错成本,毕竟我们很难保证自己一次就成功吧。OpenAI在过去花在ChatGPT/GPT这一领域的资金应该有十几亿美金了,这是近100亿的投入。尽管前方已经光明了,但是你怎么保证自己一定在花完几十上百亿后,能得到自己想要的呢?
人:NLP这个领域,国内做的人不少,但是真正有机会玩得起LLM的人,可能并不多,不过应该不难吧,从OpenAI的论文上看ChatGPT应用的并不是更新的东西,而是成熟的,所以是个工程问题。
数据:这个最有优势的应该是百度吧,做为中文最大的搜索公司,肯定是有尽乎全网的数据缓存,所以它家起步应该是最方便的。但是不清楚他们会不会很快走上一条快捷的路径。所以别的大公司还有足够的机会。毕竟谷歌给了我们一个坏的示范,Bard并不理想不是吗?它告诉我们,有人有钱有算力有数据,但是只要人不是最恰当的人,不会马上得到最好的结果的。
=》当然,数据可能中文面临的一个问题就是垃圾的信息其实是相当多的,是不是能有效的过滤这些垃圾信息,也是一个难题。
算力:尽管美国禁了我们的A100以上的GPU,但是现有的计算基础我想训练出这样一个模型应该是不成问题的。我们也会很快完成这方面的基础建设,毕竟Nvidia的东西做出来是要卖的,卖产给谁不是?
综上,可能我们大概能做到ChatGPT的水平,但是未来是什么样呢?
OpenAI是会进步的,按以前的估算,他们应该会在今年上半年,最快3月份左右公开GPT-4,也就是ChatGPT的下一个版本,这个版本会给我们带来什么样的惊喜,谁还都不知道呢。
国内的一些,你知道,我知道,但是没有明文规定的东西,其实是对这方面有非常大的阻碍,毕竟这种潜规则的数据限制,AI是很难避免或者说避免不了的。
另外就是ChatGPT已经开始在Bing上应用了,但是这个应用在国内是不是能顺利的使用到?我觉得不会,因为微软是熟悉中国的。
在这个时间结点,我想做为普通人除了应用ChatGPT外,可能更重要的是学会思考AI会带给我们什么。下面这本书才是给我们带来思考的方向