22-12-07 19:05 微博认证:即刻官方微博

ChatGPT除了好玩,还能在哪些不同领域有应用场景?产出的质量如何?在哪些领域会更有优势?

这几天即刻里关于ChatGPT应用场景的讨论很有趣。即友Diiiii结合自己大模型对话机器人使用的经验,从创作类、专业类、助理类三个方向20个场景对ChatGPT进行了测评总结。

创作类:总的来说,可以达到九年义务制教育的及格水平。
▶ 写作文:用闺女的小学语文作文题试了一下,记叙文的描写合格,议论文的观点自洽,结构完整,能达到初中生的水平;
▶ 格式化内容写作:政府公文、演讲稿、公关文、产品发布通告等等,能达到中规中矩的水平,但不会特别出彩。
▶ 新闻写作:目前拒绝连接互联网,拒绝获取实时内容,所以问他“最新的世界杯比赛结果”或者“预测一下世界杯冠军”这类问题都得不到答案;
▶ 虚构类创作:可以写打油诗、歌词,可以创作小说或游戏的大纲和梗概,并沿着大纲进行剧情的拓展,剧情过于俗套时可以开一些脑洞,被要求在给定的情节中,可以做一定水平的细致描写。适合作家用来找灵感,也适合网文作者用来注水(有逻辑地注水,很实用);
▶ 非虚构类创作:抛出一个明确的观点,能写出前后连贯的八股文,勉强能达到发👸号的水平,但就不要指望阅读量和传播了;
▶ 其他:搞笑的是,居然还有人用ChatGPT去写喂给Dall-E的prompt,这也算是不同领域机器人之间的协同了...

专业类:最大的问题是事实经常搞错。另外过于专业的内容无法胜任。这可能是由于训练集过泛造成的,如果在一些指定的领域里做finetune后效果应该会好很多。具体来说:
▶ 翻译:能做一些翻译,效果感觉不如DeepL;
▶ 科研:问了几个领域比较前沿的技术,基本给出的都是初级科普水平的答案,再多问就答不太出来了;
▶ 金融:我自己尝试问了很多行业调研、企业财报相关的问题,都被拒绝说无法回答。但看到有别人用它来问一些资产负债表里的内容,也能得到答案;
▶ 投资:看到有人试着写商业计划书,以及给VC的pitch文案;
▶ 人力资源:看到有人尝试着写简历、写招聘文案、拒信和新员工欢迎信,本质上也都是格式化类的内容写作。还有人试着用它来写周报和年终总结,但由于缺乏实质性内容,也都是套话,最终效果中规中矩
▶ 法律:尝试着写了一些法律文书,比如顾问协议、借款合同之类的,格式看起来像模像样,但不知道实际上是否符合规范;
▶ 销售:可以写一些销售话术,通过增加“有煽动性的”、“有说服力的”这种形容词可以让文字的风格更加强烈;
▶ 客服:能够写非常成熟的客服邮件,用来应付各种刁难的用户责问,还可以选择不同风格。当然,这一块已经有很好的其他解决方案了;
▶ 编程:看到有人尝试,不知道效果如何。

助理类:
▶ 闲聊:能够流畅地完成多轮对话,但沟通的距离感较强,亲和力不够,不知道是不是人设的缘故;
▶ 日常问答:做菜、保健、医疗、生活常识,都能给出相对比较实用的答案,能给出一般电器的操作步骤;
▶ 出行规划:试着做了一份7天游埃及的行程,中规中矩,但搞错了一些基本事实(比如认为埃菲尔铁塔在埃及),能够根据需要做行程的修改,但结果并不是很令人满意;
▶ 子女教育:能回答类似“适合10岁女孩读的历史、科幻类英文小说”这种问题,给出的推荐还算靠谱;
▶ 购物推荐:能给出一些不错的购物推荐。

总而言之,如果说机器人更多是用来代替“初级体力劳动者”的,那么ChatGPT更多是用来代替“初级脑力工作者”的。整体上,它更像是一个较为理性的“助手”角色,通过一对一的沟通来帮你解决问题。

ChatGPT还未能取代Google和百度,但它已经能在一些场景成为我们的小助手。即友Diiiii或许能打开大家的思路,欢迎补充。

#ChatGPT# #机器学习# #人工智能#

发布于 上海