翻电Special 建立当下与chatGPT协作的迫切性、想象力和技术 feat.雍福会•碎片谈 VOL.113
最近呢,我们做了很多关于hppt的节目啊,一共呢,已经有两期电台节目和一篇文章的篇幅了,那我自己的判断呢,虽然啊,这个程序离通用性人工智能强人工智能或者大家想象中具有真实智慧和意识的电子程序还有完全不是一回事儿。
而且呢,我也认为他在这个比如说比较长城的reasoning方面有很多的劣势,有很多的缺陷,但是在那个文章中呢,我也表示啊,这应该是自互联网以后最大的一次技术。
革新和革命了,这个绝对不是危言耸听。也不是一句大话,这绝对是一个可以真正从根本上改变我们社会形态的一个程序,也是一个重要的起点。那之前的节目呢?很多是关于这个技术本身的分析啊,技术逻辑啊,技术对于社会的影响啊。
那今天这期节目其实是一个非常非常实际的节目,这个节目呢,就是从甚至从knowhow的层面之上,我们应该怎么想象我们与这个技术本身的协作,以及在当前版本之下。
我们与Jetgpt协作的一些实用建议的探讨好,我们就来看看这期节目。
我们现在开始就欢迎大家来参加第17的碎片谈,然后我也能看到这个话题有多火了,之前的活动确实没有一次来过这么多的人,这个呢,确实是最近特别特别火的一个话题,而且这个话题还不是火一下,这个话题已经火了。
快4个月了,从去年11月底到现在,呃,个月就这3个月期间啊,这个话题不仅热度没有降下来,而且可以说这个话题越来越火,越来越火。当然,我相信,呃,在座的很多朋友应该不是第一次听跟相关的内容了,那今天我们这次呢,其实它还是有独特的关注点,它本身没有特别关注对GDP好坏本身的描述,就是它行不行,怎么不行,我觉得今天我们采取的是一个比较实用的视角。
今天这期节目呢,或者这期活动,我们主要其实还是想说我们怎么跟AI来合作协作,这本身呢是一个比较来讲,我觉得比较实用的一个,而且从这一点呢,我觉得大家也更容易把这种技术应用到自己的生活之中,因为说起来这很可能是自。
我也不知道互联网之后最大的一次吧,就是之前的各种热潮,不管是VR等等的,都绝对不会有这个带来的影响力这么无远弗届,当然这是我本人的看法,就是其他在座的人,包括很多人可能会有别的判断,那今天呢,终于不是我的这个单口了,因为大家听我单口应该也快摊也快听烦了,今天是有嘉宾的,有这个什兰女士对大家欢迎他。
对。
对这个是单女士呢?
是咖啡科技的创始人和CEO,有很多这个IT领域投资的经验和营销的经验。而且刚才聊啊,其实本身已经开始在做基于GDP的是的应用了,也是基于AI领域的应用啊,所以本身呢也是有实战经验的,应该有很多可以分享内容。这个什兰女士呢,不仅是在这个IT领域啊,就整个跟MIT,还有MIT中国等等运营的教育方面有很多投入,所以教育领域呢,也应该是蛮熟悉的,
而且实际上教育我觉得也是会被AI深度塑造,而且很可能对社会冲击。
可能最大的一个领域之一对那今天除了在座各位是蓝女士参与呢,这个期待gpt也很有幸参与我们今天的活动啊。我我今天下午准备的时候瞎想的,我就给他说我说今晚我们有个沙龙要聊聊这个人跟AI协作的问题啊,如果要让你开个厂,你会说什么?
然后当然我用我用英语问他,因为现在如果你你使用,你会发现使用英语效果好很多,我把它翻译成中文吧,就是为我们这个活动置了一个开场词,他这么说的,他说女士们先生们。
晚上好,我很高兴今天能在这个沙龙上就人类如何与AI合作的可能性和方法讲话。人工智能日益成为各行各业的重要工具,人与人工智能的协作潜力无限,人类与人工智能之间的合作为在研究创新和解决重大问题方面都取得了进展和突破。然而,必须认识到,将人工智能融入人类活动会带来独特的伦理和社会挑战,需要引起我们的注意。为确保人类与人工智能之间的成功合作。
我们必须培养一种透明相互尊重和信任的文化,了解彼此的长处和局限,并共同努力克服挑战。这对我们至关重要。
本次沙龙本次沙龙的讨论提供了一个机会来探讨这些主题,并确定提供一些最佳实践和策略的例证已在人类和人工智能之间建立有道德和负责任的伙伴关系。我相信我们可以通过合作取得伟大的成就。
很高兴听到大家对这个重要问题的见解和观点,感谢大家今天给我发言的机会,我期待一场引人入胜且富有启发性的讨论,并祝愿你们在继续探索人机协作的可能性和方法方面一切顺利。
说实话,我觉得水的稍微有一点点水啊,就是不是特别特别的有启发性。总的来说呢,符合他最近出这种文本的这种比较水的水平和特征,反正滴水不漏,也是说的都是正确很漂亮的,但是洞察力不是特别高的话,当然我们今天的讨论很大程度上就是我们如何使用能够突破这一层比较General比较水的这一点啊,看有没有可能性能够为我们生活提供更多的可能性。
好,今天呢也是一期很实用的活动,因为探讨的是距离使用吗?呃,也希望能够实现这个包教包会的这个效果,但这是开玩笑的,应该不太可能。所以今天这个过程中,大家如果有问题呢,我觉得一定要提,就是你听到任何地方有问题你就提出来,我们就问题展开讨论,我相信史老师肯定也能给大家很多的很重要的见解,因为时老师应该是这里面比较少的已经有实战经验的人。
好,那我最开始问一个问题啊,我们看看就是。
按理说应该问没有用过的举手,但我们还是让用过的举手吧,就用过切尔gpt的举手一下。
举高点好吧,我看看啊因为今天人特多。
啊,也就基本上都用过了,但是还是有一些人没有用过,当然没用过的有各种原因啊。
最近好像注册也不是很方便了,慢慢慢慢搞得越来越麻烦。
那用过的人呢?我就想问一下大家有没有什么例子,就是你在使用过程中有没有让你比较惊艳的一个例子,当时你怎么使用的,或者有什么输入它给予你的输出,你觉得哇,这个都能说的出来还挺厉害的。
坏的例子我们就不征集了,有很多我们来征集一些好的例子有没有。
好,你说这个你还知道呢就是想不起来。
让那个chatPPT帮忙写Tinder自我介绍。
嗯,对,他当时给了3条建议,就是第一条,务必简短第2条做你自己第3条带一点小幽默。
就是他,他没有真的帮你生成一个没有没有没有,我就问他怎么写,他就说了3条。
这是不是一个特别特别好的例子?
对,我先说我自己的例子吧,我确实有个很好很好的例子,因为当时我正在想测一测这个其他的这个reasoning水平有多高。
然后我就问他一个问题啊,我就说这个旗帜为什么在人类的生活中是这么重要的一个象征物,为什么什么东西里面都会用到这个旗帜,它像写了一篇论文一样,给了我非常详尽的论述,而且我觉得就是在我看到的论理论述中啊,这篇的水平算是比较高的,因为。
现在GDP经常会输入特别水的那种,就是像像这样刚才那样的很水的,其实没有什么营养洞察的话,但他对于旗帜的这个政治和社会分析,那一段我觉得写得特别特别好,当时我甚至觉得读完都哦好多点,我以前没有想到过,还挺厉害的,你们有吗?
其他人有吗?
哦,来,阿姨,未来你是什么?呃,
因为我是做那个户外广告的嘛,所以就是其实有一些,比如像上海地铁客流量,呃,我们内部有的有一些数据我们都不是很透明,因为它涉及到炸鸡数据。
然后炸鸡数据是一个还蛮保密的,然后,呃,但是其实这个就是结果分为2种情况,就一个是因为中文,就是在微信上就是迅速有了那个的那个小程序对话聊天人,然后在那个上面我我用那个中文去问他,呃,比如说19年哪一个站,呃,在几月份的这个客流量大概是什么数据,它可以答的出来,然后那我。
呃,呃。
他其实是在一个区间,就是正确的区间范围内的。
对,但这个具体数据没有办法考据,但是对还蛮正确的。
然后我又问他说,那你最新的数据,就比如说陆家嘴站,你最新的数据你是你有吗?然后他说,呃,他基于推测,陆家嘴站,呃,今年3月,呃,比如说2月份的数据或1月份的数据,他说了一个推测值,然后这个值我有问过,就是相关的从业人员,他说是看起来非常正确的一个值。
但是我在那个就是hppt英文的那个界面去用英文跟他提问,他就说,不好意思,我的最新的数据是2021年他就没有任何其他比较细节的回答。
对,反正这也算是一种优势吧,反正你问什么他都敢说对不对,可能要再去核实一下,这倒是来你。
因为我是程序员嘛,然后我给了他一段,那个我自己写了一个C的一个函数,然后让他给我做一个codereview,然后这个因为也因为我知道它在2022年gpt三当时加入了GitHub的数据吗?
按说他对大家都发现他对代码的这个理解能力很强,但是我这段代码也是没有开源的,而且包括那些函数的名字呀,我都是自己瞎起的,然后他他review出来基本是正确的,就把我函数的功能就那个函数的功能描述的比较准确。
对代码部分其实也是最近讨论的比较多的一个点,石老师有吗?在使用的时候,呃,您有一个。
我,我们因为已经在我们的一个产品中间吧ChurchVt给加进去了,所以很明显的就是我们原来用了另外一个合作伙伴是上一代的,技术上一代的自然语言处理就是以前的客服机器人可能都会用那种技术,然后大家都会说,哎呀,这个对话有点傻,但是我们用了Checkgpt之后,明显的代价跟他对话的欲望,什么就得到很大的增强,所以我觉得当他用在一些你想,嗯。
打造更流畅的对话场景。而且你在这中间希望塑造一些情感的感觉的时候去PPT还是挺有用的。
嗯,对,这个确实啊,很多人初期使用,不管他水不水或者其他的,我觉得大家都应该会有一个感觉,就是还是挺惊艳的,就不管是他对你话语的理解能力,还是他输出结果的能力,就这是我们以前没有见过的,就以前没有见过这一点,大家也很明显的发现,其实在出之前甚至GDP三出之后。
就各路大佬都没有对这个东西寄予过这么大的关注和厚望。
就现在这一炮点燃啊,感觉全世界的投资的钱都要燃向这个GPU的熊熊大火中和殿和这个电费的运算上了。
所以这也是其实很多人我我认为啊,其实是在公测之前,大家其实并没有预料到的一次科技的高峰,呃,这波高峰我觉得也不仅仅是这个GDP,
2022年可以说是年末的一个最高潮,实际上2022年整一年。
都是这个AI应用的有点元年性质的。
那之前呢,不是自然语言对语言更多的是自然语言转这个图像,像这个DellEto和stablediffusionJourney啊,很多都用了。呃,这个我也想问问在场有已经把这个东西整合到实际工作中成熟使用的人吗?就是。
呃,你。
你是怎么使用的?
因为,呃,我身边会有很多是那种设计公司的老板,然后他们要去我刚刚跟你们讲了一点,就是他们要去投标竞标,然后其实一个竞标的案子,他们连那个。
建筑的设计图都能够打印出来,都能够AI算出来。
所以他们有的时候在竞标的时候,他们可以一天用那个AI的算法把竞标案给做出来。那如果是一个完整的团队的话,他要2周的时间,这就是他跟我讲的。
还有一个他们会训练那个制图的AI的,嗯,比如说有一些对黄种人的一些偏见,就是收将军,不是张飞和关羽,是元代的将军,然后收女性都是丹凤眼,然后没有嗯,甄嬛传里的女性。
他就会要一直来训练那个AI的算法的东西,让他除了图是他能够用到它实际工作的AI的图片。
这是他们作为嗯创业者或者是工作人员的状况。
呃,对于那个stablediffusion是开源的嘛,所以说已经很多人拿拿这个开源东西做自己的项目了,其他人有吗?
就是已经在这个工作中开始。
大规模的使用这些图了因为前2天其实网上还有一个争论,对吧?
应该是有一个画师再给一个网游来出它那个汤用途的时候,被很多人质疑啊,他那款商用图是AI画的,虽然他后来自己有提供那个草图,
但草图呃,AI先出图,自己在画个草图一个2分钟的事情吧,所以那个最后呢,可能也没有完全洗白,但是我觉得他最后是不是真的用了AI,
我觉得没那么重要啊,我觉得这大势所趋不可阻挡,就算这次他没用,那未来各个画师。
大官大范围的使用这个AI出图或者AI出图精修啊来完成,我觉得已经是这个不可阻挡的。呃,
实际上我自己也大规模使用了,因为我自己做podcast,平时有一些很多的海报啊cover设计,那之前海报cover设计我都是在Googleimage上搜一些图来用,但这个问题呢,就是你很难保证这些图都是同一个风格对吧?因为你这次搜这个关键词,那是那个关键词,有些是照片,有些是水墨画,就是每次涂都不太一样,当然这也是呃风格吧,但是有了这个dial一吐。
之后呢,我就可以保证啊,至少一个系列的图全是一种风格的,就是我完全可以让用用使用非常近似的text,包括使用那个在生成图的方式。
General的1系列风格非常统一,主题很统一的图,这个我已经完全把它用到了我的生活之中,而且其实用起来使用的速度绝对比在Googleimage图其实还是要快的多的,我觉得这个确实是很有用,那就想请请教一下施老师,就是其实上一波那个AI啊,大概是16年就AlphaGO。
的时候,AlphaGO的时候已经燃爆了一波AI了。但其实中间沉寂了几年,从AlphaGO之后,整个社会对AI的关注其实没有那么高,当然有各种各样的原因啊,可能疫情也是一个原因,但是为什么从16年到之后,他并不是一个逐渐走高的过程,而是他好像有一个做至少在公众舆论层面相对的成绩,但在2022年突然爆发出来,这中间大概发生了什么呢?嗯,诶,
大家有多少人看过或者知道那个戛纳的技术成熟度曲线可以举个手。
嗯,对,其实这个是,呃,任何一个技术都会有这个过程,就是每个技术刚起来的时候,在它爆发性增长的时候就得到很大的关注,然后有一段时间是幻灭期,大家发现说,诶,好像短时间内也不能制造出我们想要的各种能力,然后他有一个相对的平缓期,最后到成熟期,AI也不例外,在历史上,AI已经经过好几轮这样爆发式的增长,然后大家又对他感到幻灭,所以上次AlphaGO的时候其实也是这样的。
这个过程,那在上一轮呃,AlphaGO很火的时候呢,那个时候用的最多的模型,或者业内大家所有去探索那个方向,其实是偏小模型,就是所有的数据都要标注,不管是文本还是图像,然后所以你看,呃,他们雇佣了大量的外包人员,都是给那些图像要打标签,包括我们每个人上网的时候,经常我们要验证你是不是一个人,就要把那些花揪出来,或者把那些车识别出来,其实我们也在帮他们做给数据打标签的事情。
那所以中国上一轮在人工智能爆发的时候,包括全球也是很多都用在这个,嗯,一个很大的方向,就是像商汤或者我们的AI4小龙是用在这个视觉识别上啊,有一个比较大的技术突破。
所以我们最大的应用场景就是安放的摄像头,嗯,各种探头,然后还有一个非常大的应用场景呢,那就是为什么字节跳动能成为1家伟大的巨大的公司,它就是用来给每个人打标签,然后根据你的兴趣来推送你喜欢的新闻。
从而衍生出他后来很多的生意。所以那一轮的AI其实更多的他是体现在他的分析的功能已经超越了人类啊。
所以很多的应用场景都不管是我们分析一个图片,还是分我们分析一个人的特征,还是分析一段文字,那这里中间就有一个关键的节点,或者大家可以经常会听到说,呃,transformer,这是谷歌在2015年左右他们写的一篇论文就是AttentionisAllyourNeed,注意力是最重要的,然后呢提出了transformer这个。
模型的框架。
那这个其实是给大家一种全新的思路,就是我们之前所有的AI研究,呃,想的都是你要垂直的数据集,要清洗这个数据,然后你要给它一定的这个模式,现在就是你可以有另外一种方式来Train这些数据了,那每个公司都会有不同的做法来做他那却gpt的这家公司,openAI也是在那个前后的时间,然后而且他们一开始的时候,他就是带了一个很大的愿景的。
他一开始的时候,呃,他就说他要做通用人工智能,就AGI,嗯,这个是,其实AIGC不是一个特别对chipPPT这样的一个特别好的一个应用的词汇吧。因为光是用深层次的AI不足以概括它给我们带来的这个巨大的影响力,其实他已经到了一种通用人工智能,也就是我们以前所畅想的说AI无所不能,甚至AI会超越人类的智能,在那个方向去前进。
但是为什么到今天这个时间节点会给我们这个社会各行各业都带来一个巨大的冲击?每个人,不管是科技界投资界企业界政府还是每个普通人,其实都有这种formal的心态,因为大家已经看到了他的巨大的能量,所以回到嗯,李老师的问题,为什么是2022这个时间点,这中间有几个关键的原因,一个就是在深度学习模型上,大的突破从transformer开始。
还有一个是算力的,极大的这个提升,呃,就是从2015年到2022年那个算力,这个数据的应用是6个数量级的提升,像gpt三已经用到1750个1750亿个参数却gpt是相当于差不多gpt3.58,他是没有公布他这个数据,但这是以前大家绝对想不到的这样的一个量级。然后还有一点就是,呃,其实越来越多的模型是给开源了,像stablediffusion。
就是一个开源的模型。
那当当开源了之后,然后当这个算力变得非常的巨大,而且算力的成本,嗯,很多人也可以access之后呢,就有更多的开发者可以在这个基础上来开发应用了。
以前虽然它也能产生出一些非常重要的。
场景或者非常惊艳的效果。但是他局限于小范围在学术圈或者在科技圈。在那个大公司之间,因为跟普通人和普通公司的距离还是很遥远,但到今天这个时间节点,呃,就是大家是感觉到说这是就像当年你在移动互联网上,你基于安卓和iOS,你可以去构建你的APP,然后你可以创造出很多创业公司,或者是更早你在互联网起来的时候,你在网页端,你可以去创造很多这个场景。
然后大家也觉得未来的这个方式就是你可以基于大模型为一个基础在上面构建,不管他的中间层还是到上面的应用层,每个人要么你作为一个开发者,
要么你作为一个创业者,要么你作为一个,使用者,你都会参与到其中,所以这就是变成它就是一个重要非常非常重要的呃基点吧。
那说到这里,我还想补充一点,就是我我这2天在跟朋友说我说现在回顾起来,我觉得reducewell还是非常非常的厉害。
就是它在很多年以前就写奇点。临近这本书的美国非常著名的一个未来学家,他在很多年以前就预测到2030年是一个奇点到来的时刻,也就是机器智能会超过人工智能的这个时刻。嗯,所以今天这个时间节点,我们我们现在来判断,到2030年这是已经非常有确定性的事情了。嗯,
好,这个,这个我可能有不不完全一样的看法,但Anyway,这个不是我们今天的重点。
我们今天没有来讨论,就是比如说强人工智能等等的,是不是能实现?
但确实像这个石老师所讲啊,就我们已其实跟AI共同生活很长时间了,不管是推荐算法面部识别声音识别,我们使用的翻译软件,包括这个OCR,把那个PDF转文字等等等等的这背后,包括我们的自动驾驶,所有自动驾驶背后其实都是AI,但2022年呢,确实有一个不太一样的,就是刚才施老师讲的,我觉得对于普通人的感受还是很强,就这个生成式的AI,这个generatedAI就像这几个生成图片的和生成文字的。因为过去,当AI其实是一种更像背后的运算机制和决策机制一样的东西。但到生成AI的时候呢,我们就首次感受到这个能够跟我们的工作实际产生连接,尤其是跟跟普通人的工作产生连接,而不是说我在一个大公司里面,我去服务于这个决策机制的构成啊等等等等的。不管是今天一个在网上水这个字媒体文章的水播客节目的水图的等等等等的。
在2022年之后呢,都找到了这个批量化水文章水图水播客节目的可能性了。
所以生成式AI呢,可以说跟大家日常的实践比起之前的AI方式就会更近。那么这一点啊,我觉得其实是需要一点想象力才能把它打开,然后我们才能落地到如何使用,如何使用,跟他协作这一点上去的,然后打开这个想象力呢,我觉得我们可以一起brainstorm一下,很有意思的,我认为这个玩意儿几乎会从背后重构。
我们现在你熟悉的经常使用的每一个APP。
每一个APP加上自然语言的大模型的AI,都会有彻底的重构,使用方法和现在完全不一样。然后我我可以问几个我们最熟悉的APP,大家来想一想,你可以设想一下,就凭借你最近使用的经验,哪些方面可以有很大的不同。第一个就从大家最熟悉的开始,微信我们就先从微信的对话功能开始,大家觉得微信对话功能可能如果接入。
会有什么样的不同?
根据根据对方说的话预判你要发什么表情。
呃,只只是预判你发生表情而已嘛,帮你发出去啊。不,不一定帮你发出去啊。就是我,我觉得这个其实很容易设想,就是很容易设想,就是当他能力再强一点,尤其是这个运算的回馈速度再快一点的时候,根据这一段对话,自从自动生成你的回馈,甚至给你3到4个选择,不会是非常非常困难的事情,就是我之前说嘛,这个在技术实现上跟这个AI的,跟过去输入法的AI的联想输入其实是很像的。
只是说它比那个能力可能强1万倍联想输入法根据你的3个字,想后面的十几20个字差GDP就可以,像这样的程序就可以根据上面的对话帮你想很多。所以未来啊,你跟你男朋友女朋友聊天的时候,随时随地可以秒回你的那个人就未必是他自己了。
包括老板想在网上查员工的港说什么什么东西,你明天给我一下,在上面背奴颜婢膝的给老板回复的那个人就未必是这个员工本身了。这个东西如果有的话是一定会被使用的,而这种使用呢,我觉得确实会彻底重构人跟人之间交交流的方式,重构人之间交流的方法啊,这个是一个其实很大的,这这这甚至是一个比较远的,那我们想得比较近的微信还有一个很大的生态,就是公众号体系,对吧?
呃,我们不说水公众号文章这个就不说了,对于使用者来讲,你们觉得这个东西接入可能会对公众号使用产生什么样的影响?
然后你说就是帮你归纳一篇文章的要点。
对以后你打开这个文章四5000字,完完全全有一个插件,直接就给你出这个文章在300字之内的缩略的总结,就大家可以发现这个GDP和其实summarize总结归纳能力挺强的,现在网络已经有网上插件了,任何英文文章的页面帮你做总结,那未来这个能力会更强,那这个呢会彻底改变我们其实阅读一个东西的办法,那除了阅读的总结。
还有什么可能性吗?
洗稿那水文章呢,我们就不说了,对,现在应该查重啊。我,我想了一个就是刚刚刚刚那个功能再进一步嘛,就可能比较乐观嘛,我比如说我是一个粉红,对,那我可能我会去去知道我的对手想知道什么,
我会刻意的去跟他描述一个呃思路或者怎么样,他跟我找到这些思路下的有哪些文章,以及哪些人会频繁地使用这种思路来。
写这个文章的人。
对这个非常容易因为1旦你可以summarize,你可以直接来说,请找到跟这个文章观点相反的文章,这个是现在绝对做不到对吧?
尤其是你现在很难知道你所不知道的东西,就是那些文章里面的用词和方法,如果你不知道的话,你是很难搜到的,但有些APP你可以直接说,请给我找十篇和他观点相左的文章,你甚至可以框一段,请找很多分析这一段的论点的文章应该是可以搜的出来的,对吧?那这个东西其实将彻底改变阅读本身的生态。
当然刚才说了很多,听人都挺吓人的,我觉得这一点倒挺好。
我今天写个文章里面也提到,我们一直说信息茧房信息茧房,那这个技术很可能是我们用AI可以实现某种程度上可以突破信息茧房的技术,就那种读到一篇文章,虽然看起来跟自己的价值观类似,但是心有总觉得有点不对的人啊,过去可能没有机会很快速触达到反驳他的,但未来有这个之后其实很容易找啊,这个是可以的,那大家在想一个淘宝。
淘宝可能。
会受到什么样的改变?
对大家想想,淘宝这个软件可能会有什么样的改变?
其实对于淘宝,这是我觉得最直接的就是生成商品的描述,然后他能怎么样,子然后什么样人会喜欢或者呃宣传词广告词这些的其实都很容易。
呃,当然文本生成肯定是因为这个这个软件很大的功能就文本生成从用户端呢?
用户端可能会有什么不同?
我就能想到一个我们经常看到一个很火的商品,下面有好几千条评论对吧?
现在淘宝只能给你这几千条评论的那个tag一些keywords,但那句犯无比,比如说外表整洁等等等等,但现在就可以帮你总结在3000条里面好的和坏的到底好在哪里,坏在哪里,绝对比keywords是一个多得多的。
这个东西呢,其实会让这个商品的评价和描述本身变得更有用,但这只是一个大家想想还有。
淘宝上还有什么?
淘宝的可能。
大家如果看了那个微软的发布会的newbean,其实上面有一种完全新的购物,因为我们现在不管是你用淘宝还是京东,你可能还要搜索到商品的关键词,自己再去找哪一个最符合。
但是如果加了人工智能之后,他可能直接根据你的要求性价比最高或者什么他就给你推荐最适合你的。
而且他中间还附了他的信息来源,都是在哪里的,可靠性各有多少,然后你还可以再进一步的去,呃,收窄你的。
想要的结果,或者是你在调整中间的一些参数。
其实这个对电商生态的改变,我,我觉得是根本性的。
嗯,对我,我举个实际例子啊,就是如果这个东西我们说到这个产品的生态上来讲,就是现在淘宝你在浏览一个商品的时候,你其实看不到这个页面以外的信息。
我举个例子啊,假设你想在淘宝上买一盆花,但你想买最好养最好养的花,你现在在淘宝搜最好养,那都说自己最好养对吧?
实际上只有引述到真正的站外知识的时候。
这个引擎才能够在商品的介绍之外告诉你购买的经验。这个其实对购买决策是一个非常根本性的改变。
其次也像是老师刚才讲的,比如说啊,你现在家里的装修风格偏黑。
所以你买这个刀有一个非常特殊的需要有菜刀啊,你希望这个菜刀是全黑的。
但是可能卖菜刀的商家从来不会觉得靠这是个卖点,全黑菜刀,但有可能有啊,但是有这个未来的gpt,尤其是多模态之后,它不仅可以独自,它可以读图之后,实际上你可以非常个性化的描述你的产品需要,这个产品需要绝对大于商家对自己产品的标准化描述等等等等,可以找到非常非常细节的东西,比如说你是个手非常小的人,你就可以说我想买一个比iPhonemini在小2/3以下的手机,对不对?这个现在在淘宝上可能很难满足你的东西。
但未来的情况之下,这个东西呢,如果整合进去就变得非常容易,就是我认为他甚至会改变现在首页以这个信息推荐刘非常不准,就是你刚买耳机可以推10个耳机,这种情况对吧?实际上这个改变是非常大的,好,我们再想一个啊。
短视频呢短视频和视频呢?
呃,我就是只说用户端啊,就是观看端啊。
生产端,现在网上已经有那种完全0人工指数标题负责出文本那种文本转声音的AI负责转成声音什么这个男人叫小帅,然后再由这个减音负责,由声音转,这个剪辑的虽然剪得很糟糕啊,现在那个剪得非常糟糕,但是0人工纯AI视频现在网上已经不少了,我们就从用户端来看,在用户端可能有什么改变。
呃。
比如说可以归纳一段就是中等长度视频的主要观点。
这样的话,就是之前有的时候可能看到一篇文,看到一篇一只视频,只是对它的标题或者封面感兴趣,但有的时候会看到后半程的时候发现啊,这个东西内容好,水就真的讲一些车轱辘话没有意思,然后就搬到退出,但其实这样很浪费时间,但如果有他那种就是语义识别的话,其实很快就可以归纳出来,我看一眼就知道啊,他想要讲什么,如果不感兴趣,我直接切走,对这个确实是一个,就是这跟我们刚才讲那个公众号文章的逻辑比较像他有这样的识别和summary。
之后,其实会让今天因为信息爆炸的情况之下嘛,我们在信息爆炸情况之下,更压缩的检索信息的能力进一步增强。还有吗?大家还能想到吗?
去伪就是验证一个新闻或者一个视频的真假吗?
对这个也是一个,尤其在我们这个领域可能就是非常实用的一个东西。因为你经常在游戏短视频的环节的非常快,你看到一个信息,如果你想很快速知道其真假的话,这也是一个。
其实还有一个就是大家一定要呃,有有这种想象力啊,就是刚才我提到一个词就多模态多模态的意思就是说现在他是texttotext,那实际上很多rumor在讲从GPUfor的时候,他其实就不止可以识别文字。
它可以识别图像啊音频啊等等东西。所以未来短视频你可以直接问他,我想找呃,幼儿时期的萨摩耶在门口的视频。
对这个就可以给你搜出来很多幼儿萨摩耶在门口和主人互动的视频,所以你可以完完全全超出标题等等内容去要求视频网站给你提供特别细节的信息。
这个信息可以是我刚才描述的那样比较图片的,也可以是内容性的。
你说我想找到观看量最大的在俄乌战争中支持俄罗斯认为乌克兰会快速灭亡的视频,它应该就很快就能给你搜出来这样的东西了啊。当然我。
呃。
我我我要是受启发,想到一个就是大家在看视频和听比如说博客的时候,尤其像饭店这种信息量巨大的就是。
不是有,有的地方可能你你想重听,但定位其实搜索的话很难搜索。可能我觉得如果有AI的话,你就很容易去定位到那个点再重新听吗?因为你你直接去找其实很麻烦就对。
那我要是哎,我就说,哎,不值得花时间重新听他讲的。
我给你讲一个吧,就别听他的了。
对,那在座应该也有很多做游戏开发的在游戏领域呢。
会有什么改变?
呃,可以举几个例子吧,呃,我自己参与过的一个是做,呃,游戏里的AI以前都是bot形式的bot形式,就是说你告诉他所有规则就是如果A成立,那么这样如果A不成立,那么再看B和C,如果B和C在看def之类的,那么这个就比较二吧,对他太机械了,那么AI的话,
他可以,你给他一个非监督学习,就是说你把它放到一个像大逃杀一样的环境里面,你们这些AI你们就自己玩吧。
然后看谁最后分数最高,然后他在迭代下个版本。这样的话呢,就至少在一个稳定的环境里面,他就很厉害,包括openAI起家,他们有一个宣传的,就是说他们做了一个Dota二的五V5的,打败了18年的世界冠军,然后而且是两局都是碾压,然后呢他们可能就因为这个突然就曝光量巨大,然后对他们后面有很多好处,然后还有就是游戏作弊会变的很简单,因为就是我最近在一个公司做一个射击类游戏的反作弊。
系统,他们里面我们会碰到很多那个作弊者,他们就是作弊,就是很简单啊,就是说我要用鼠标瞄准对方头把他打死,比如说这个这个头角色头都一样吗?
然后。然后这时候我们就会很困难,因为他们所有人电脑上只运行了一个Python,然后他们就很可能作弊,然后我们就要用反反过来检测他的鼠标是否是异常的,正在向角色身上瞄准之类的。
我们要用AI去跟他对抗,不然我们也没有办法,所以就会不断的这样子,就是我觉得未来游戏都会很就是你所有线上的游戏都无法。
是真实的,就像洗稿之类的你你现在的你的水平也不是真实的。
所以这些都很麻烦,我觉得会未来游戏行业会很很难说这个。
对,其实还有一个,因为有很多呃,偏RPG的游戏就是都有一个很好的设计嘛,就是你在游戏里做的抉择和你在之前选择的对话会影响之后对吧?
因为现在的开发都是一个偏树状结构,其实很困难,你很难做出非常非常多的可能性,因为他这个可能性几乎就如果你不做收束的话,它是无限扩展的,但有这个或者这种AI的加入呢,实际上之前尤其是比如说之前的对话,对之后的对话产生很大的不一样,这个可能性变得非常简单。
所以之前在游戏里面非常非常好的这种就是你自己对这个世界产生真实影响的体验。
在未来,尤其是在对话层面之上,可能会变得相对简单一点,那这个对于很多游戏来讲,体验也是跟过去相比碾压性的好。
你看刚才我们讲的呢,都是具体的APP或者是具体的程序类型和这个程序类型,在接入这种GDP类的generatedAI之后产生的影响。那接下来呢,我们也可以说几个领域,大家可以想想这些领域。
产生的影响第一个就是刚刚我们说的这个教育领域,所以刚好因为这个时,老师对这个教育领域其实也有很比较多的关注。
比如说您觉得这个有了这个之后,我我相信不光是您自己想啊,应该业内应该已经有很多很多关于这个的讨论了,这个很可能会对教育会产生什么样的影响呢?
嗯,对,其实现在有很多大学已经开始抵制,却gpt了。嗯,因为本来在大学里写论文是一个很重要的能力,但是现在大量的学生都开始用XP来辅助写论文。嗯,
所以不管是在中国还是在海外,我,我觉得这个是很,但是我觉得大学来抵制他是一个无用的动作,因为人工智能只会变得越来越强大,其实应该想的是。
去改变教育的这个方式。所以也有一种探讨,就是大家觉得可能会像嗯古希腊的那个时候诶有点像咱们今天这样的一个方式的学习,就是大家坐在一起讨论,嗯,然后回到那个,
其实这是一个很昂贵的学习方式,因为你必须所有的人在一起,而且要有非常好的moderate,就像李老师这个moderate是一个关键的角色,
呃,但确实是现在西方的一些教育界,他们在讨论说未来的教育。
是不是会返璞归真?回到这,因为你,你首先过去的AI是帮助我们,你不需要再去记那些死记硬背的东西了。
现在生成式AI把我们需要做很多创意制作的方向也都解决了,那人类到底还做什么?那可能我们要回到最初就是我们的思辨哲学和人类更有原创动作,呃,以及就是在其他的一些方面,人类可以做一些什么,这是教育界在思考的第一个方向,当然现在。
如果单纯就缺gpt来说,他是一个文科生,就是她数学很差,呃,数理化都不太好。
呃,他最近,嗯,有有实验给他做了一下中国的高考试卷,然后就可以发现说它的这个语文政治,呃,还有就是跟文科相关的得分基本上都在78十分以上,这个分数很高了,因为是没有经过预先处理的,他是直接拿了试题直接做的,但是数学物理化学就是。
基本上是不及格的水平,所以,嗯,大家经常会拿这些gpt来做数学题,发现他都打错了,因为。但是因为他本身就不是为了这个而设计的。
呃,所以如果你你需要他来答题的话,可能你现在的一种做法是把它放在一个编程中间,你到GitHub的去运算了,再把那个数据取回来,
但是在呃,真正的在教育领域的话,正好我最近在跟一些。
教育界的朋友交流,他们说它是可以哪怕在数理化这个领域,它可以做非常好的解释的工作,比如说非常复杂的一个化学的方程式,然后你你告诉你来给我做一些解释,他就会一层一层给你讲的非常清楚,那这个之前可能没有任何一个教育工具可以做到这一点,然后当然其实我们现在只说的是在今天的教育场景中,我们在怎么用它,如果放眼去想象,如果我们想象不是今天的交易场景,而是我们。
真的到了这个生成式人工智能或者是ATI通用人工智能,已经跟我们每个人的生活息息相关的时候,其实我们更应该思考的那个问题是教育还需要交什么?
嗯,这个是就是从孩童时期开始,我们更应该思考的是这个问题,因为显然。
如果我们还是依赖于现在的这种工业化时代所带来的教育方式的话,我们培养的人,其实他所掌握的知识却gpt,在几分钟之内可能就完全复制了。
那既然他离开考场走向社会的时候,他就可以用chiptvt,我们为什么一定要用一堵墙隔着他,让他先这么学了18年甚至22年,然后只要等到他离开考场才能用券gpt,肯定不是这样的方式,那那个我,我觉得这是更多的是就是我们人类存在的价值。
是什么?然后我们的教育去怎么赋予每个人他应该存在的这个价值,那是更远更远的一个话题,但确实也是跟我们每个人息息相关的,大家都还很年轻哈。如果你们已经是父母的话,那我觉得这是一个很迫切的话题了,就是你的孩子要怎么去教育,呃,那他这个与生俱来的,作为人所具有的那种创造力和好奇心就变得特别特别的重要,那是特别需要呵护的,嗯。
对,就像这个老师老师讲的啊,这个教育领域其实是可以说自上而下根本性的一个颠覆,而且我们其实也可以想象很多中间层应用,比如说我能想到一个很好的例子,应该很快就会有我感觉啊,这应该是很大的一个领域,而且商业化前景也很不错。
全定制化的语言学习,呃,变成一个完全可能的事情,比如今天我们用语言学习,不管是线上还是线下的方式啊,实际上它也没有完完全全根据你现在对这个语言的掌握能力,有那么快速的responsive,可能老师都不行,如果一对一老师就非常昂贵,但有这个之后呢,完全一对一的跟你现在对那个语言掌握能力严丝合缝,咬合的全定制化的外语学习,呃,不管是现在文字的或者语言,未来多模态之后,有语言的将变得非常容易。
啊,这个东西。所以说你看俞敏洪现在没有回去做新东方是对的啊,对对,但是现在回去做新东方,可能,呃,只能往这个方向进步了,未来这些英语老师应该被淘汰的会非常快,那除了这个还有很多啊,就像刚才施老师讲的,不只是我们今天这样的场合,我们用探讨的方式,实际上就像石老师刚才讲的一点,就是这个在解释能力上其实非常强,而且呃,如果就是普通的教育啊,我们也没有需要太精深的知识或者太逆袭的知识来讲。
我相信现在很多问题的解释是比一般的教师的能力要强很多的。所以未来的学习完全是可以以比较小的班级或团体,就算是很小的小孩都有可能,比如67个人加一个协调性的老师全部由这67个小孩儿与这个程序的对话,由程序的对话之中。按照这个协调性,老师给了一个agenda来完成这样的对话和询问,非常快速的询问答疑对话来吸收知识,获取一些视角都非常有可能,所以这种。
从普鲁士到现在这种课堂式的方法,我觉得可能会有,呃,迎来它的终结,所以对教育领域,我觉得这个怎么去强调对他的影响都不过分,不管是从应用的层面,还是根本模式的层面都有变化,也是刚刚老师说的,就是现在的我们掌握的很多技能啊,对这个GDP来讲啊,掌握起来非常快,所以在这个非常惊心动魄的,我们快要被机器人替代的这个风险之后,我们就可以来说这个问题了,那至少啊。
现在这个版本的GDP,至少我还感觉比较安心。我觉得我好像还暂时无法被她替代。
那就有另外一个很实际的问题,我该怎么跟他协作?他有没有可能能够让我的工作和生活变的更好好,那有协作的得需要有目的,我觉得在做。我们先问问大家这个问题啊,先不管能不能实现,就是你现在设想中你工作的哪部分,你特别希望他帮你完成它。
对吧?
那部分大家能想到吗?比如说如果你说的话,你就说说,比如说你现在大概是做什么的,你觉得里面哪部分你特别希望,就我们不畅想未来的程序,就今天这个版本的GDP,你特别希望他能帮你把这事儿做。
啊,因为我们团队主要是做篇动画一类的,可能就是未来,呃,如果这个它能够真的通用实现的话,那可能我们在顶层,像我们可能编剧把storyboard做好以后,它就可以自动帮我们生成相匹配的分镜头,然后分镜头匹配完之后,可能我们有个校正的过程,校正完之后再去拿去输出给到像C4的或者是ue这样的软件,直接就可以生成成片动画。
像我们可能正常的一部5到10分钟的动画,可能需要30到50个人的团队工作一个月,那现在如果用这个软件,它直接去做的话,可能会很高效。对,但是你这个还是有点儿敬畏来,就可能我不知道后年能不能实现,就是肯定这个版本的是做不到的。
首先啊,这个商业模式肯定会从openAI外围有很多做二次开发,做应用层的公司,未来在任何领域你都能够找到很多,呃,为了各种不同的目的所形成的这个generated。
AI的程序,那我们今天呢,就是想更积极一点,我们不等到这些公司开发出来,反正大家也都用过,我们今天在那个网页上能实现了啥帮我们点啥。所以说我们还是先不说这个近未来的就是说现在的你们有没有谁工作中啊。
呃,我有,呃,我现在其实做的主要是类似数据分析,像的产品经理,然后呢,这个就非常有帮助啊,比如说我们反作弊团队开发的工具,他说可以抓到外挂,然后我不是程序员对吧?
那我首先我想知道这个工具效果怎么样,我就直接,但数据库我又不是特别好,那么数据库跟他打交道,你要写那个MyCircle,然后我就问说我想知道,呃,最近一年这个工具每个月的表现是怎么样的,然后呢,你就告诉他你的那个关键词是啥?
然后告诉他写一个语言,然后你就输进去然后输完以后,呃,你生成表格以后你说我,哎,我想生成一个报表给领导看,然后我要怎么用Python自动把这些数据转化过去啊,你就等于是你,就不需要程序员辅助你了,或者说你只需要很少的,你就可以完成,本来你做不到的就相当于你就是。
就是你只要有想法,你的实现变得非常简单。
所以这个会让非程序员的人更容易的,至少是插入到这个主动的参与中会非常容易。
对,这确实是一个特别特别好的还有呢啊。
呃,我就。
我就想说一个基于刚刚的那个刚刚提到那个Checkgpt的那个归纳的那个功能可以做,就是我是一个做实验物理学研究的,然后我我们在这个阅读文献的过程中最经常遇到问题,就是你会查到一堆非常非常水的文章,然后他们里面可能写的很多东西都是错的,或者是根本就没有解释清楚的。然后我想查下gpt,如果他有这个归纳的功能的话,就可以帮我们筛掉那些非常烂的那种文章。
对,我觉得他这个需求提的非常好。
好在哪里呢?
就是你看他刚才开始想了,也就是说这绝对不是一个你那么容易,你说我给你贴一篇,你说它好不好,绝对是现在如果你用这个操作去做,完成不了,但是通过一些通过一些fileshop,你可能可以帮他去构建的,呃,这个一挥而就会说到这个具体讲啊,但我们先采集到这个需要这个需要特别好,而且这个需要有一定的深度,就是它是比这个水文章来讲可能。
跟水文章不是特别一样的,一个需要,这个需要是可以实现的,但它就需要我们对于的交互有一些方式方法才可以实现的了。
还有什么样的需求?
好那那先先你在他。
嗯,这个其实不是我,是我正好过年回家,是我姐姐是他做英语老师的。然后他正好就聊天聊到这个问题,他说他要做什么分层教育,然后他经常需要去找一些视频啊,或者什么文章材料给学生讲,但是就是找到的东西,可能词汇呀或者语法就有的很难,有的很简单,他需要改一下,然后这样正好我就正好那段时间也差的火嘛,结果试了一下就说我说把这个文章改改成简单的词汇和简单语法这个。
做得很好,就是。
对,就是文本的转换和处理是很容易的啊。
那么我们来看后面这位。
对我突然想到我这个例子跟大家不太一样。我是一个做偏文职工作的,就是在跨国公司里面做一个商务部门呐。
我发现大家很多时候开会呢,就是地区跟地区开会,地区跟区域开会区域跟总部开会,然后支持部门跟业务部门开会,部门A跟部门B开会,最后找商务法务HR协调。
那我觉得如果有了chatPPT的话,这些会议都可以减缩就变成了你,比如说如果在中国的话,谈成一个事儿,大家拉个微信群就是你OK吗?你OK吗?大家对齐吗?
可以推进吗?支持到位吗?
资源到位吗?
还可以追加吗?就这些问题,其实都可以交给hppt,他只要跟每一个大佬去给他。
基于现在的情形总结一下我们这个事情进展到了什么进度,现在需要您给个拍个板,A还是B,就是我觉得可能公司里面大概2/3的会都可以不用开了。
但这个也是个镜未来的就至少现在这个版本的期待GDP还无法实现,但已经有很多做会议软件的想实现这个功能了,就是它给你自动生成会议的这个agenda会议纪要,会议里面需要决策的点帮你来弄,还有吗?
好的,呃,我最近因为我是一个建筑师,然后我们那个公司是做那个弓箭比较多,就是对政府的,然后我最近就用那个斋,呃拆gpt写那个设计文本,然后因为那个就是大家懂的那个政府,他就喜欢片儿汤话就是写深了。
你也看不懂对,所以就是用那个写特别方便,尤其涉及到,比方说你写一个城市,然后你就把它输进去,然后给他一些关键词,然后他会告诉你,
哎,这个城市历史怎么样,然后可以让他边一点儿很有那个历史感的这种设计描绘,然后他就会给你出一些很片儿汤的东西,对,就挺好用的。
对这个应该是现在最成熟的一个应用了,就是我们管叫叫办公厅gpt就是这个非常非常成熟啊,也是很容易出的啊。
因为我也是那个建筑师,然后我就可以补充一个就是因为我们,呃,就是建筑,如果是根据全流程的话,他有1/3时间在做设计,但2/3时间会在施工图阶段,然后,但是每个从国家规范到地方规范都不一样,然后我觉得确实GB可以很快就给我搜索出我需要什么样的数据。
然后包括我们计算什么消防人数,它也可以很快根据面积,然后你什么类型,然后我就可以什么楼层,就这些数据它可以算出来,然后包括你防火间距怎么做?
我觉得这些都减轻了建筑师的负担。
对这个也涉及到我们一会儿讲这个fileshop刚好您最近不是也已经开始做这个PHP实战,你们在做产品了吗?
它是一个什么样的需求呢?就是现在这个版本的API可能都可以实现的。我我我正好顺着李老师的话题,我在问大家一下,就是前一阵呢,其实他们做过一个测试,就是从1月底到2月份就到现在哈,大家猜一猜在全球使用最高的呃最多的是哪一类的人群?
这里有一些候选项,有设计师,程序员,编辑,呃,还有学习的人,嗯,就是学生这一类的,然后还有这个科技的工作者企业家等等。那猜一猜最多的是什么人?
程序员,程序员的举个手。
呃,OK设计师呢?
学生的呢?
呃,猜程序员和学生的最多哈,呃,其实最多的是设计师就是那个使用设计师,设计师使用却gpt的是程序员的4倍多,这个是MagicalAI最近做的,然后他们在做这个调查之前呢,其实他在Twitter上发了一个投票就是大家认为谁会使用最多大概有50%的投票都投认为是程序员会使用最多,然后后来。
他们用的这个方式呢,是说如果你还用这个软件,你同时用HP,然后最多的同时在用的软件是Adobe,然后是看wer。
所以我回到我们说我们在做的这个产品呢,我们做的这个产品就是把htt跟marketing和creatures结合在一起的,因为我们觉得这是一个很大的使用场景。
当然咖啡科技因为本来就在做元宇宙营销,所以我们我们在元宇宙营销这个领域呢。
就是,呃,做过很多像麦当劳奥利奥保时捷美的这些在行业里比较有影响力的一些案例,然后我们也在探索一些新的应用场景,那我们自己的团队很痛苦的一点,就是我们经常要做提案,那提案的时候所有做过提案大家都知道,就是当你firstRough,你就初稿出来之前,其实团队是很花时间的,所以他们有一个这样的曲线,有点像个勺子,嗯,就当你有个spark。
你有个灵感的时候,你的能量值是蛮高的但是当你再继续想我要出那个初稿的时候,你的能量值就下来了,就到那个勺子的底部,然后再慢慢的哦,终于有一点想法,终于把这个初稿做出来了,然后最后你在finetune一下,然后你初稿对吧?但是每一个做创意工作都会经历的这个过程,那cheapPPT或者其他的这些AIGC生成是A,最大的作用就是帮你把这个勺子的那个下凹的曲线给拉平了。
所以你从你的spark灵感出来,他可能一下子就可以给你生成10个主意。
如果是图形的,就是图形,如果是文字的就是文字,然后你拿着这个去跟你的老板或者你跟你的客户来Check说,诶,你觉得这个中间你挑23个对不对就会很好,否则我们原来的平面设计师出的凡是关键词去跟客户确认,或者是一段描述,客户都说好,让拿了几张样稿,客户也说好,但是真正初稿出来,客户都说,嗯,这不是我要的,然后再从头来过。
所以就是这个应用场景,我们觉得已经很成熟了。那当然海外有很多公司,像最早把gpt三用的很好的Jasper点AI,他们一年半时间已经成为估值15亿美元的独角兽,就是做这个方向的就是formarketingandcreatures。所以我们在做的这个产品呢也是这样,但我们现在还只是在产品的研发阶段,那今天也非常高兴我,我觉得看到现场好多朋友应该都是我们的,呃,非常精准的。
潜在的目标客户,所以我也想邀请大家,稍后如果有机会的话哈我们我们加一个微信,我想邀请大家感兴趣的话可以做我们preAlpha版本的呃,和种子用户来测试一下,那我们想做的事情就是帮大家快速的生成初稿,然后这个初稿是融汇了有文本的生成,有图像的生成,有平面的排版啊,大家就把这3个功能集合在一起,文本的生成的话,当然,嗯,tvt就是一个很重要的文本生成的。
工具,还有其他的一些模型,那图片的生成的话,呃,现在大家用的比较多的stablediffusion呢,呃,这个dailyto啊,还有其他的一些我我们我们也当然国内的话,文星艺格文星译言,呃,我们也会接,因为可能不同的模型,它出来的东西还会有一些不同,然后尤其是在响应速度上,因为Coffee科技呢,我们正好也是微软战略孵化器的成员,所以我们很早就跟微软说,能不能帮我们对一下openAI,我们在研发一些这些产品。
是面向,呃,这个很广大的中国的用户的。然后我们得到一个信息,说这还是一个月前了,我们跟微软说微软说你知道吗,我们的list有1000个公司在排队,而且这1000个公司都是迪斯尼呀,三星啊,包括中国的阿里啊,都是这些大公司都想跟openAI去接,所以大家可以想象说全球有多么多么火,然后很当然也有一部分小公司在特定的场景中间会用。
所以他们,呃,现在应用的最大的一个方向。
哎,大家也可以猜一猜这些大公司选择去接最大的一个应用方向,你们觉得是在哪里?
对,是的,chatbot就是这个对话机器人,因为ChangePT本身它就是一个对话的,但Checkboard,它不仅仅是可以用在客服机器人上,它也可以用在很多的场景上,所以这个我们预测未来会有非常大的呃变化吧。那在中国的话呢,因为文星译言就百度的这个基于文兴模型的ATrapgpt可能是希望说就是,呃,李总是下了死命令,
月底必须出产品,所以他们整个。
整个团队啊,就是日以继日日已结业的在这个发明这个新产品出来时候我们到底也可以拭目以待。看一下那文星艺格呢?
我们的新飞猫马上会跟他一起做一个呃AI创意大赛,星飞猫是我们自己推的一个元宇宙IP是个FT那就会基于文星艺格,这是他的图片的部分来做一个创意大赛,那这个就是很容易是来做二创,那做二创其实也有一个好处,就是大家如果在做产品或者你们在做什么。
设计是用很容易去把你的客户给engage进来,呃,因为你要客户完全从0到1去开发一个产品去创造一个图片,他还是辛苦的,就写prompt是很难的一件事情。
现在好的prompt工程师已经出到200万的年薪,呃,来请好的prompt工程师了,但是如果二创的话就比较容易,你给他一些喂一些图片或者为1些东西,但那样的话你很容易来做一些消费者互动的事儿。对。
这是我们在做的一些实践。
最后提到那个prompt,我们就从prom开始啊,因为毕竟啊,现在什么是prompt?我先说这个词,prom就是指你输入给他的东西,就这么简单,你输入给他就prompt,然后他有输出,所以你有好的输入,他才有好的输出。
所以我们今天就从这个点来来讨论讨论怎么使用这个东西啊。呃,
因为毕竟很多这些产品,我觉得大家可以后续关注,就是你那个内测出来可以发,我觉得可以发在这个群里面啊,他们有个听众群,大家可以积极参与一下,我觉得可能会让你在你们企业呃,短期取得一个降维打击。
的这个优势对Anyway,我们收回到这个使用上来。
这个prompt,呃,大家以前其实都肯定都用过搜索引擎,有人用的厉害一点,有人用的不那么厉害,实际上搜索引擎就是一种prompt对吧?
你输入这个关键词,他给你生成结果,那么搜索引擎呢,有人用的好一点,有人用的不那么好,有没有认为自己用搜索引擎用的比较好的,可以说一说。
你。
你就抽象一下概括一下你觉得搜索引擎的关键技能这个prompt的技能是什么?
有没有谁好?
对是精准的描绘词汇,而且,呃,而且我们也会发现真正比较好的使用搜索引擎其实也不是第一下就搜出来对吧?
你很可能是点开2个3个页面之后浏览这23个页面的内容,发现,哦,这个词儿对吧?
这个词儿我只要加进去就能搜出更精确的。所以搜索引擎的prompt是什么呢?就是不断发现跟你的需要更接近的词汇组合,到4个词汇组合产生了一个搜索结果。
那么这一点啊,很多人已经搞不定了。
因为我们发现很多人非常直觉式的使用搜索引擎直觉式的方法就是他有什么问题。
他就像使用git一样,在搜索框里面打,把那个完整的问题打出来。那么。
我们就收回去TT啊。
搜索引擎的规则我们是知道的。比如说Google采用pagerank这个关键词的匹配程度,所以说如何用更好的关键词搜出内容,其实这个过程我们是了解的,但AI难在哪儿呢?
因为AI本身是一个黑箱,就我们其实并不知道,也其实也没有人知道他是怎么样最后生成那个结果的,这背后有非常复杂的神经网络的运算,所以在这个角度上啊,它其实比搜索引擎的难度要大。
就如何在gpt上做好的prompt,其实比这个关键词的组合这个事要难得多。
所以说我也认为我们用搜索引擎是可以直接搜到非常精准的你要的结果的啊。这个结果有时候是一个事实,比如上海哪个地铁站的人数,中国去年的债,国债务总量等等等等的。
但这些问题你可以在问,也可以在必应的那上面问都可以,但有时候你要的东西并不是事实对吧?
你要的是一段文本,比如你要水篇文章,如果这个给你的文本拒水无比的你,你你拿去做这个行政流程可能还行啊。
但写在这公众号里面你就觉得就就有点掉价了,对吧?
那么你就希望他给你不那么水的文章。
但是呢,这一点啊,就跟这个搜索引擎不一样,它会比较难,所以我们从这个地方开始啊,就是什么样是一个好的prompt啊,就像这个施老师刚才讲啊,一个好的prompt的人已经有这么高的工资了,就如果你啊,在你自己使用过程中磨练出这个玩意儿,说不定未来是一个好职业呢,而且我认为未来是一定会有这个职业的,很大程度上跟他这个黑箱,不用未来哦,现在就很多。
在购物Problemjunior好那一会儿,呃,讲完了大家给我打点钱啊。
好,这个开玩笑的。AI本身是一个黑箱。
因此啊,有一个很重要的东西,就像我们不要直觉式的使用搜索引擎一样,你也不要直觉式的使用gpt。
这个东西,它的构成和这个产品的设计,希望你直觉式的使用它。你要想要什么你就问他,但你要这么用的话,他几乎不能给你特别特别好的东西,它可以用特别水,所以你不要直觉似的用它是怎么用呢?
我举一些小的例子啊,你们有没有人装那个插件,就是Google。
没有啊,OK,那个是是七RGB的一个插件。这个插件呢,其实就是你把账号登录之后,你在Google搜啥,你的Google搜索框右边就有一个他的插件,在Chrome上就出差的结果,因此你会发现啊,你根本跟拆机不用打滑关键词他也能出东西啊,有时候出不了,比如他说我,不知道你说的是啥,你得在specify你的那个词汇是什么,但很多时候3到4个关键词中间的空格连起来。近期htt。
给的东西啊,比你好好问的东西要不水的多。
对,呃,这个这个原因我我可以简单讲一下,就是说最简单的讲吧,就这个程序根本没有在理解你说什么话,这个这个transformer没有所谓的理解,它就是一个续写程序,也就是说它的训练过程就是有海量的数据库和文本,你给他3个词,他去猜,第4个词最有可能是啥,他们就用这个方式在文本库里面训练它去。
精准的拆出后面的词。所以它没有语法,没有知识,没有逻辑,没有reasoning,没有理解,没有语境,就是往后猜词的游戏。
当然啊,在实际使用我们的现象语言现象的层面,他已经有一些的,比如自然对话是非常好的reasoning,在某些情况之下也存在。那我们要明白啊,这个模型背后其实是没有再管这些东西的,它其实是个啥呢?
它其实是一个语言分布。
就比如说你,你在前面写啊,康德哲学什么相当于,当然这个过程非常复杂,相当于这3个词在他的这种高维空间构成了一个吸引子,那跟在他过去的46T的数据里面,跟这3个词关系最近的词是啥,他就能够在算法的程序之下,以合乎顺序的方式排列出来。当你说康德政治学19世纪,他就这些词又在高维空间形成一个吸引子。
那么又构成了新的词语分布的输出。
所以说当然这就跟Google搜索不一样了,我们你你你可以把这个过程想象成,虽然你不可能完全知道它的作用是啥。
我我我有个特别好玩儿的一个比喻啊,大家以前可能在手机上玩过一个游戏,这个游戏叫炼金术士alchemy玩过吗?就把这2个元素合在一起,可以生成这个元素,这个元素跟那个元素生成1起合成那个元素等等等等的,你完全可以用occur的心态来想象你把每一个词汇。
尤其是有表意功能词汇什么theis这些就是什么EDINGING没有它的动名词,他不去做token就是你完全可以把你的词汇输入当做炼金术士的元素,然后他在他的这个大铁锅里面煮煮煮煮煮给你煮出来。新的话有一些词汇配方出的话没有那么水,有一些词汇配方出的话特别水,而且一定是元素也其实也不是说越多就越不水。
有时候多反而水,因此呢?
我们刚才说这个搜索引擎的能力是这个Wordcombination能够精确地对应到你的需要,那么其实就是你每一次都像炼金术士做实验一样,你再用不同的词汇组合去慢慢呈现出符合你需要的不那么水的内容,至少从内容创作上可以这么来想这个问题好,从这个问题上我们就可以往下来讲了,因为毕竟他不是。
一口气完成的,你可以继续和她对话。
大家在网上会看到很多跟的聊天啊,会有比较粗暴的对话方法,就是告诉他continue。
对,对吧?
很多很多都是这样的,他可以出一段,因为比如说我水篇论文需要3000个字,呃,比如6000个字,但其实每次输出的文本量,它那个token是有限的嘛,那你就不会让他continue让他给你输,但你要想象,实际上这就像在这个炼金术士的大锅里面,你每一次给他的第二句话,其实也是一些被他的Attention机制被抓住的重要的词汇和词汇组合,投进这里面和之前的那些料。
放在一起,再炖出来。
所以你给她continue的话呢,就没有新料该怎么水还是怎么水,你不可能通过多次continue,他突然给你出端部水的,当然也有可能啊,这个因为是黑箱,你很难讲,但可能性就不大。所以说在你继续和他对话,希望他继续说的时候呢,你一定要向这个炼金术一样往里投出新的东西。所以,呃,以刚才这段只是一个比较基础的,它这个mechanism的一个描述就是这个程序大概是是这样运转的,至少这个程序。
在我的理解之下,它大概是这样运转的所以说,呃,你首先当然你你也比较好对他用自然语言来也不是像搜索引擎一样,因为在一个语句里面,你的意思也会比较明白。好,
这里我就说一个比较有意思的了,我最近一直在做做这个实验,我发现效果还挺好,我举个最直接的例子啊。
我们经常在给他问问题对吧?什么什么东西或者我要个什么样,你能给我妈你能写个什么什么什么吗?
我就发现,既然它是一个。
最基本的程序来讲,它是一个续写程序,对吧?
它是从你的话往后续。
你就不如把问题就问程序写。
比如说我要写一篇文章我就别说我想写一个俄乌战争的文章你能写吗?
我就把这个文章的Generalidea就是你把你想写的观点像那个第一段的前半句话一样,你把你该你你最开始告诉他,请续写以下段落冒号,然后你把你续写的词汇要素要的结论列出来,然后你说请续写,然后他给他写。
我每次发现当我这么输的时候,其实效果都不错啊,我觉得原因也蛮多啊。
一方面呢,是在你给出续写段落的时候,你很有可能比你自己纯粹问他,我要写个个俄乌战争。
文章你其实提供了更多的词汇,对吧?你其实提供了更完整的,呃,用人我用用我们人来讲,提供了更完整的语境和目的,对程序来讲,就是提供了更多的Attention的head提供了更多的可以,甚至在高维空间形成多个吸引子的那种条件。所以说如果你要水文章这点,或者需要他给你输出信息,你不如就按照他是一个续写but来想象你就让他直接续写,呃,我,我这几次测测下来。
及时发现效果是不错的。
然后这个是一个,当然啊,我绝对认为这个绝对不是穷举了所有的可能性,就是第一句prompt的方式就是因为这个程序如此复杂,就像刚才时老师讲的,这可是1750billion的parameter,这些复杂的简直是几乎是一个不可知的复杂性。
所以说什么样的叙述能够出什么样的结果是高度不确定的,所以很有可能你需要去。
就像做实验一样。你要是很多不同的词组和和描述方式,甚至这已经构成第一层复杂了。
第2层复杂就是比如说你用一个词组和他给你出的结果,你觉得好像还可以,但你通过什么样的问题能让他写得更好呢?最后形成了第2层的复杂程度,对吧?
所以这个事儿要去master的啊,我觉得难度是不小的,但是如果一旦master了,其实收益是非常非常巨大的,就是它的效率如此之高,我我们都不说什么水文章。
洗稿这种比较不好的用法了。就算你要做一个领域的研究,你希望他给你,就让他陪你做brainstorm,帮你想到足够多的有意义的视角和方向,它的效率绝对比56个人憋在会议室里面要快的多得多,因为它输出文本的速度是非常非常快的,只要你的prompt本身是合理的好,这里这里是我讲的第一点啊,
就是,呃,你不要直觉式的使用它,不要因为它做成了对话式机器人的形式。
你就严格遵照对话,你就要知道你给关键词,他也能出结果。
你让他续写他也行。
他不一定是问题是交互的,因为本身它并不需要真正是一个对话,这个可能更接近这个程序本身的构成和用法。
好第2个我就来说啊,就是怎么样可能能prompt出比较好的结果。
我的一些想法呢?
哎,呃,这样吧,就是进入到下一个之前,我还是先问问,就是除了我,因为这个东西的,我觉得可能性是无穷的,你们应该也在网上看出有人不知道输什么东西,程序就开始回家,就是开始出这个乱码了对吧?这也是说明在那个空间里面可能形成了一个bug似的回复,那你们有在使用中,比如说偶然诶。
我完全没有用自然语言或者问答式的方式,以对话式的方式可能竟然出了比较好的结果。就除了我刚才说的用搜索是的关键词,和我刚才讲的那个续写续写命令之外,有没有别的你们的经验中已经遇到过的。
有吗?因为理论上这种可能性是无限的。
对这个例子我不知道这个是否就是符合您问的。
问这个问题就是我一我是一直让HP帮我写邮件。
然后一开始的话,可能我会比较给他的值,就是指令使得,比如说我这份邮件中,他主要要,呃,完成3个目的要跟客户交代这三件事情,然后那样子发现他的邮件可能是非常多的车轱辘话就有点水,然后我后来自己实践出来的一个方式是我让他做我的proofreader,就是我可能会自己先写一个非常简短的200个字,但是我会不顾语法不顾任何的东西给到他,然后说可以rewriterewriteit's,然后我会发现它给到我的东西。
就质量很好,嗯,然后甚至有的时候我可能会在写的过程中进入到一些非常细节的部分,是一些技术上的他就是其实客户不需要知道的,我发现他会帮我引掉那些细节的部分,所以我觉得好像这是我找到了一个跟他互动比较比较好的方式吧。嗯,对,我觉得这个方式这个方式跟刚才讲的是有呃是有很多很类似的地方的,就是你的第2种方法,其实你给他提供了更多,而且不是那种信息,你看第一种方法,你给他提供的是被人总结和归纳之后的信息。
我给客户写东西,我要表达以下这3个目的,对吧?第2种方式,你提供的是与输出文本更接近的信息就是他不需要二次概括,但是呢,你,你给他提供了,其实就是续写逻辑嘛,就是你要输出的文本,一种可能的词语分布情况,你发现他就做的不错,我觉得这本身就是个很好的例子,就是你把他真当人看,你说我有这个目的要完成,他可能完成不好,你把它当一个更机器的角度去看待他,你给他四境的property,初级的property。
就是一个比较接近你输出内容的东西。
这很可能是至少最近这个版本啊,可能相对比较好的一个用法。
对,这是个好例子。
好,那我们就来说说啊,就是这个你你你给他提供的这个文本是什么什么什么样可能好一点的。
呃,你在网上搜呢他就会说要提供更精确的文本,上下文更清晰。
但是对机器来讲,什么是更精确的文本,上下的更清晰,是一个挺有意思的问题啊,就是我试了挺多,当然这只是一点点的经验啊,就绝对不可能穷举,也不可能穷举。我发现呢,你也可以想象这个片儿汤话跟片儿汤话之间是有类似的,比如说片儿汤话跟片儿汤话最类似的一点呢,就是词汇的多样性比较差。
片儿汤话吗?大概都是一些比较尖锐的词汇,概括性比较强的词汇。
飞片儿汤话呢,会用一些比较稍微刁钻一点儿的词汇,所以说我就觉得啊,你在跟他输入信息的时候,如果可以高度术语化高度术语话,就是你以你平时绝对不会术语化的形式来描述是好的,就你平时讨厌那种说话文绉绉<装