研究发现:人工智能模型在识别无效信息方面存在挑战

     在巴黎,9月15日——周四发布的一项研究显示,支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。...

  Study: AI models struggle to identify nonsense

  在巴黎,9月15日——周四发布的一项研究显示,支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。

  来自美国哥伦比亚大学的研究团队指出,他们的研究揭示了当前人工智能模型的局限性,并警告在法律或医疗领域使用这些模型仍为时尚早。

  研究人员对9种人工智能模型进行了测试,向它们提供了数百对句子,并询问哪些句子可能在日常交流中出现。

  此外,他们还让100名参与者对几对句子进行相同的判断,例如:“一个买家也可以拥有正品/一个精通高中圆周的人我漫步。”

  这项研究发表在《自然机器智能》期刊上,研究团队将人工智能的判断与人类的判断进行了比较,发现了显著的差异。

  像GPT-2这样的复杂模型,作为病毒式聊天机器人ChatGPT的早期版本,通常能与人类的回答相匹配。

  然而,其他一些较简单的模型表现则不尽如人意。

  研究人员强调,所有模型都存在错误。

  该报告的作者之一、心理学教授克里斯托弗·巴尔达萨诺(Christopher Baldassano)表示:“每个模型都显示出盲点,将一些人类参与者认为是无意义的句子标记为有意义的。”

  他补充道:“这应该促使我们深思,人工智能系统在多大程度上能够做出重要决策,至少在目前是这样。”

  论文的另一位作者塔尔·戈兰告诉法新社,这些模型是一项“令人兴奋的技术,可以极大地增强人类的生产力”。

  然而,他认为,“让这些模型在法律、医学或学生评估等领域取代人类决策可能为时尚早”。

  他说,潜在的陷阱之一是,人们可能会故意利用模型的盲点进行操控。

  随着ChatGPT的发布,人工智能模型在去年突然进入公众视野。自那时起,ChatGPT通过了各种考试,并被誉为医生、律师及其他专业人士的潜在助手。(法新社)

本文来自作者[访客]投稿,不代表nslqa号立场,如若转载,请注明出处:https://m.nslqa.cn/keji/202507-1442.html

(12)

文章推荐

  • 马赫:哈里斯应对以色列保持沉默,她要么在胡说,要么无能为力

    在周五播出的HBO“实时”节目中,主持人比尔·马赫表示,2024年民主党总统候选人、副总统卡玛拉·哈里斯对战后以色列-哈马斯局势的解决方案太糟糕了,“如果你想说这些,那就什么都别说,闭嘴就好。”这些天每个谈论以色列的人都充满了“它”,或者只是没有处理实际问题。马赫

    2025年07月03日
    13
  • 评论家称这款低价水瓶优于斯坦利

      《赫芬顿邮报》及其出版合作伙伴可能会从其网站上的一些购买中获得佣金这页上有墨水。每件商品都是由《赫芬顿邮报》购物团队独立策划的。价格和供应情况可能会有所变化。你可能听说过斯坦利·昆切(StanleyQuencher)的玻璃杯,凌晨3点就有买家排队购买限量版颜色的玻璃杯,以免售罄。斯

    2025年07月09日
    14
  • 观点|我阿姨的村庄欢庆摆脱俄国统治

      现在,俄罗斯人已经从第聂伯河西岸撤出,乌克兰人在通往克尔森的路上,解救了一个又一个村庄。其中一个是斯坦尼斯拉夫(Stanislav),距离克尔森(Kherson)大约24英里,我的婶婶和叔叔住在那里。自3月份以来,他们一直处于俄罗斯的占领之下。“我们活下来了,我们活下来了!”这是我67岁

    2025年07月11日
    12
  • 詹妮弗·洛佩兹再次尝试挽回本·阿弗莱克,但未能成功:她对他充满思念

    据报道,詹妮弗·洛佩兹最近试图与本·阿弗莱克和解,但失败了,因为这位演员似乎执意要离婚。据《Closer》杂志报道,洛佩兹希望提出离婚能促使阿弗莱克重新考虑他们的关系,并试图挽救这段关系。然而,她的计划似乎产生了相反的效果,阿弗莱克没有任何试图阻止他们分

    2025年07月14日
    12
  • 西南航空推出首个红眼航班,增设热门活动的便捷服务

      西南航空公司(SouthwestAirlines)最近推出了一系列新的航班服务,旨在为旅客提供观看热门体育赛事的便利。此外,西南航空首次推出了夜航服务。以下是新产品的概述。为橄榄球爱好者提供免费往返服务在扩展大学橄榄球和职业橄榄球的航班服务

    2025年07月17日
    13
  • 特朗普竞选团队请求在选举前配备具备反导能力及其他安全措施的军用飞机

      ˂imgsrc="http://post3.qytdi.com/file/upload/202410/12/wu3ouibfrrc.wdp"alt="2024年7月13日,共和党候选人唐纳德·特朗普在宾夕法尼亚州巴特勒市的巴特勒农业展览中心竞选活动上被看到脸上似乎有血迹,被秘密服务特工包

    2025年07月18日
    9
  • 空乘人员误将乘客认作史努比,搞笑瞬间引发误会

      美国西南航空公司的一名空乘人员将一名乘客误认为说唱明星史努比·道格,并要求与他自拍,这一举动在网上走红。不幸的是,这位VIP乘客不像史努比狗狗,更像鲶鱼说唱歌手。这位明星的堂兄随后发布了一段视频,揭露了这一骗局,获得了数百万的观看量,并吸引了评论,抨击这位易受骗的机组人员。蒂莫西

    2025年07月30日
    14
  • 南非118岁女性被誉为全球最长寿女性之一

    南非图斯里维尔——周五,一名南非妇女在她的养老院举办了一个小型派对,庆祝她118岁的生日,她是世界上最长寿的人之一。据一家慈善机构向记者展示的玛格丽特·马里茨的身份证复印件显示,她出生于1906年9月27日。这家慈善机构帮助组织了在开普敦东北180公里(110英里)

    2025年08月11日
    10
  • 玩家必备“微乐捉鸡麻将三丁开挂”分享装挂详细步骤

    微乐捉鸡麻将三丁开挂是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。微乐麻将可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义微乐麻将系统规律,只需要输入自己想要的开挂功能,一键便可以生成出

    2025年08月11日
    9
  • 指定教程“跑胡子可以作弊吗知乎”确实果然有挂

    跑胡子可以作弊吗知乎是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义手机打牌系统规律,只需要输入自己想要的开挂功能,一键便可以生成出

    2025年08月12日
    9

发表回复

本站作者后才能评论

评论列表(4条)

  • 访客
    访客 2025年07月25日

    我是nslqa号的签约作者“访客”!

  • 访客
    访客 2025年07月25日

    希望本篇文章《研究发现:人工智能模型在识别无效信息方面存在挑战》能对你有所帮助!

  • 访客
    访客 2025年07月25日

    本站[nslqa号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 访客
    访客 2025年07月25日

    本文概览:     在巴黎,9月15日——周四发布的一项研究显示,支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。...

    联系我们

    邮件:nslqa号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们