你的位置:九游体育官网 九游娱乐「NineGameSports」官方网站 > 新闻 > 现金九游体育app平台视频中的手脚通常带有特定的主义性-九游体育官网 九游娱乐「NineGameSports」官方网站

现金九游体育app平台视频中的手脚通常带有特定的主义性-九游体育官网 九游娱乐「NineGameSports」官方网站

发布日期:2025-01-23 17:03    点击次数:190

新闻

东说念主工智能离不开数据。为了教师算法以已毕预期主义,咱们需要无数的数据现金九游体育app平台,而输入到 AI 模子中的数据质地径直决定了输出效果的优劣。干系词,问题在于 AI 树立者和盘考东说念主员对所使用的数据开头了解甚少。比较于 AI 模子树立的复杂性,AI 的数据汇集实践尚不老到,大界限数据集频繁空乏对于其内容和开头的详备信息。 为了科罚这一问题,来自学术界和产业界的 50 多名盘考东说念主员开展了数据溯源盘算推算(Data Provenance Initiative)。他们淡薄了一个

详情

东说念主工智能离不开数据。为了教师算法以已毕预期主义,咱们需要无数的数据现金九游体育app平台,而输入到 AI 模子中的数据质地径直决定了输出效果的优劣。干系词,问题在于 AI 树立者和盘考东说念主员对所使用的数据开头了解甚少。比较于 AI 模子树立的复杂性,AI 的数据汇集实践尚不老到,大界限数据集频繁空乏对于其内容和开头的详备信息。

为了科罚这一问题,来自学术界和产业界的 50 多名盘考东说念主员开展了数据溯源盘算推算(Data Provenance Initiative)。他们淡薄了一个肤浅而蹙迫的问题:构建 AI 所需的数据究竟来自何处?为此,他们审查了近 4,000 个寰球数据集,这些数据集涵盖了 600 多种讲话、67 个国度,并包含长达 30 年的数据,数据开头触及 800 个私有的渠说念和近 700 个组织。

这项盘考的效果初度独家发布在《麻省理工科技挑剔》上(文末附陈说流畅),揭示了一个令东说念主担忧的趋势:AI 的数据实践正在使权益过度结合于少数几家主导科技公司手中。

神情成员、MIT 盘考员 Shayne Longpre 默示,在 2010 年代初期,数据集的开头相对各样化。

这些数据不仅来自百科全书和互联网,还包括议会记载、财报电话会议以及天气陈说等开头。Longpre 指出,在阿谁本领,AI 数据集是凭据具体任务的需求全心规划并从不同渠说念汇集的。

干系词,2017 年,撑持大讲话模子的架构——Transformer 的出现,更变了这一切。跟着模子和数据集界限的握住扩大,AI 的性能权贵提高。这使得 AI 领域迟缓倾向于给与更大界限的数据集。

如今,大多数 AI 数据集是通过从互联网上大界限、无离别地捏取内容构建的。自 2018 年起,互联网成为总共媒体类型(如音频、图像和视频)数据集的主要开头。与此同期,汇集捏取的数据与更为全心规划的数据集之间的差距迟缓袒露并握住扩大。

“在基础模子的树立中,数据的界限、异质性以及汇集开头对模子才能的影响无与伦比。”Longpre 默示。对数据界限的需求也极地面鼓舞了合成数据的鄙俚使用。

连年来,多模态生成式 AI 模子应时而生,这些模子冒昧生成视频和图像。与大型讲话模子不异,它们需要尽可能多的数据,而当今最优的数据开头是 YouTube。

以视频模子为例,从图表中不错看出,超 70% 的语音和图像数据集的数据齐来自团结开头。

对 YouTube、Google 的母公司 Alphabet 来说,这可能是一个强大的上风。与文本数据散布在繁密不同的网站和平台上不同,视频数据高度结合在单一平台。

Longpre 指出:“这使得汇集上一些最蹙迫的数据的按捺权高度结合在一家企业手中。”

此外,Google 自己也在树立我方的 AI 模子,这种强大的上风激励了对于公司若何向竞争敌手提供这些数据的疑问。AI Now Institute 的和解实践主任 Sarah Myers West 默示,这值得进一步探讨。

她以为,“咱们应该将数据视为通过特定历程创造出来的东西,而不是一种当然存在的资源。”

她补充说念:“若是咱们过去使用的大部分 AI 所依赖的数据集反馈的是大公司、以利润为导向的企业的意图和联想,那么这将以适合这些大企业利益的方式重塑咱们的天下基础才能。”

这种单一化也激励了对于数据集是否冒昧准确反馈东说念主类体验以及咱们正在构建何种模子的疑问。

Cohere 公司的盘考副总裁、Data Provenance Initiative 成员 Sara Hooker 默示,“东说念主们上传到 YouTube 的视频频繁是针对特定受众而制作的,视频中的手脚通常带有特定的主义性。”她问说念:“这些数据是否捕捉到了东说念主类存在的总共细微离别和各样性?”

隐蔽的按捺

AI 公司频繁不会公开用于教师模子的数据开头。一方面,这是为了保护其竞争上风;另一方面,由于数据集的打包和分发历程复杂且不透明,AI 公司自己也可能无法透顶了解所稀有据的具体开头。

此外,AI 公司可能不了解这些数据在使用或分享时所受到的按捺。Data Provenance Initiative 的盘考东说念主员发现,很多数据集附带有严格的许可条件或使用条件,例如,可能按捺其在交易用途上的诓骗。

“数据开头空乏一致性,使得树立者很难正确选拔使用的数据。”Hooker 默示。

Longpre 补充说念,这也让树立者险些不可能透顶确保他们的模子莫得使用受版权保护的数据进行教师。

连年来,像 OpenAI 和 Google 这么的公司与出书商、Reddit 等主要论坛以及酬酢媒体平台达成了独流派据分享契约。这种作念法进一步沉稳了它们的权益。

“这些独家合同执行上将互联网分袂为谁能看望和谁不成看望的不同区域。”Longpre 指出。

这种趋势对冒昧包袱此类契约的大型 AI 公司成心,但对盘考东说念主员、非谋利组织和袖珍公司则组成了不利。这些较小的参与者将难以获取必要的数据,而大型公司不仅能缔结独家契约,还领有最刚劲的资源用于捏取数据集。

“这是咱们在灵通汇集向前所未见的新一波非对称性看望。”Longpre 说说念。

西方与其他地区的差距

用于教师 AI 模子的数据也存在严重的地域偏倚。盘考东说念主员分析发现,进步 90% 的数据集来自欧洲和北好意思,而来自非洲的数据不及 4%。

Hooker 指出:“这些数据集仅反馈了咱们天下和文化的一部分,却透顶忽视了其他地区。”

用于教师 AI 模子的数据也存在严重的地域偏倚。盘考东说念主员分析发现,进步 90% 的数据集来自欧洲和北好意思,而来自非洲的数据不及 4%。

Hooker 指出:“这些数据集仅反馈了咱们天下和文化的一部分,却透顶忽略了其他部分。”

教师数据中英语的主导地位部分不错用互联网的近况来评释。Hugging Face 的首席伦理学家 Giada Pistilli(并未参与这次盘考)默示,互联网上进步 90% 的内容仍然是英语,而地球上很多地区的互联网联接极度差,以致莫得互联网。不外,她补充说,另一个原因是便利性:创建其他讲话的数据集并将其他文化纳入研究需要有领略的贪图和无数的使命。

这种数据集的西方倾向在多模态模子中进展得尤为表示。Hooker 例如说,当一个 AI 模子被指示生结婚礼的场景和声息时,它可能只可呈现出西方婚典的方式,因为它的教师数据仅限于此。

这种情况强化了偏见,可能导致 AI 模子鼓舞一种以好意思国为中心的天下不雅,从而肃清其他讲话和文化的存在。

Hooker 指出:“咱们在全球范围内使用这些模子,但模子所能看见的天下与看不见的天下之间存在强大差距。”

1.https://www.technologyreview.com/2024/12/18/1108796/this-is-where-the-data-to-build-ai-comes-from/

2.https://www.dataprovenance.org/Multimodal_Data_Provenance.pdf

在好意思国有这样一起东说念主尽齐知、长幼齐宜的中华料理,那就是大名鼎鼎的——陈皮鸡!相干词对此肯定许多国东说念主却并未传说过,这也难怪,毕竟这说念菜发明于国外,况且最伏击的是,其创举东说念主程正昌不论怎样也不肯将其带归国内实行。 这就有些令东说念主微辞了,在好意思国这般的“好意思食稀薄”都能年入两百亿,一年光原材料就能奢靡五万多吨,倘若在中国踵事增华,想来一定会赚得更多。 那么这究竟是怎样一趟事?这说念菜到底是凭借什么火爆好意思国,程正昌先生又为何刚毅阻隔将其带归国内呢? 少年离乡 一切的一切
阅读此文之前,空乏您点击一下“眷注”,既轻便您进行商榷和共享,又能给您带来不一样的参与感,感谢您的支执! __群众好!老徐我又来啦!最近,甘肃玉门这地儿火了,原因嘛,房价低到吓东谈主!一套90平的屋子,你敢信?只有1万块!几乎白菜价啊!这不禁让东谈主想起前几年的鹤岗,相似是资源衰退型城市,相似是低房价,这背后的故事,值得咱好好唠唠。 玉门,往时那然则响当当的石油之城,新中国第一个石油工业基地,妥妥的“铁东谈主”王进喜闾阎!1939年,中国第一口油井——老君庙一号油田就在这儿出身,玉门整夜之间,
猪价相接跌了近100天!迎来了这三天的“超跌大涨”,可喜可贺!还有东谈主顺服猪价会跌到7块吗?还会跌到7吗? 乱套了,猪市透彻乱套了,抢着卖猪的,压栏的,回归卖不掉亏钱的,一股脑合计猪价大涨的,还有合计猪价大涨后要跌回7块的...... 动动脑子吧!查一查,上市大集团场的欠债率几许! 再看一看,大集团的生息资本几许 再跌,大集团场,把统共东西卖的六根清净,也还不上贷款! 会歇业的!会倒闭的!阿谁本领散户裤衩皆没了! 养猪行业,就透彻瘫痪了!没东谈主养了,转瞬就要吃高价“猪肉”! 你说跌到7 可
据中国证券报近期,A股商场并购重组活跃度赫然进步。11月以来,有46家上市公司发布并购重组有关公告。而上年同期开yun体育网,仅7家上市公司发布并购重组有关公告。其中,11月下旬以来,有10余家上市公司发布并购重组有关公告。 国泰君安研报默示,2024年以来,跟着并购重组策略贬抑细化落地,10月份公告履行紧要重组派别创月度新高,上市公司并购重组热度回升。 业内东谈主士默示,公司通过并购重组兑现协同,不错改善计议效劳,兑现更高的收益增长率,进步股票价钱。 不外,对于上市公司及投资者来说,并购重组
波音开云提款靠谱官方入口,这家也曾翱翔于蓝天、引颈航空业巨头的百大哥店,如今却深陷泥潭,无法自拔。 新任CEO凯利·奥特伯格的上台,似乎给波音带来了一线但愿。他,能否成为波音的救世主? 凯利。面对波音连年归天、订单流失、安全事故频发的窘境,他深知必须接管果决法子,才能扶持这家摇摇欲坠的航空巨头。 于是,他建议了一个神勇的谋略——大范围裁人,尤其是针对那些非中枢岗亭的职工,其中不乏印度裔。这一有策画,犹如一颗重磅炸弹,在波音里面掀翻了山地风云。 波音的败落,并非一旦一夕。频年来,飞机安全事故频发
据大师时报近日报说念,欧盟计较条目前来设厂的中国大陆企业转让本事给欧洲企业,以疏导欧盟的接济。新法则将先适用于电板企业,以后可能扩大至其他享接济的绿色产业。英国《金融时报》引述欧盟官员的话称,新的本事转让法则将于12月着手纳入10亿欧元电板建筑接济案。据报说念,跟着欧盟对中国科技居品入口的纵容增加,包括宁德时期在内的大陆企业转而平直在欧盟投资九游体育官网登录入口,如在匈牙利和德国投资建厂。出息能源也在西班牙和法国投资建厂。 欧盟思用从中国电动车收取的关税来补贴中国车企,欧盟只需要“左手换右手”
公司地址:

新闻国际企业科技园4388号

关注我们:
官方网站:

www.uniquevin.cn

Powered by 九游体育官网 九游娱乐「NineGameSports」官方网站 RSS地图 HTML地图


九游体育官网 九游娱乐「NineGameSports」官方网站-现金九游体育app平台视频中的手脚通常带有特定的主义性-九游体育官网 九游娱乐「NineGameSports」官方网站