以文本方式查看主题

-  课外天地 李树青  (http://njcie.com/bbs/index.asp)
--  信息检索原理课件  (http://njcie.com/bbs/list.asp?boardid=16)
----  [转帖]谷歌被指操纵希拉里搜索结果,技术真相揭秘  (http://njcie.com/bbs/dispbbs.asp?boardid=16&id=1712)

--  作者:admin
--  发布时间:2016/6/12 9:24:06
--  [转帖]谷歌被指操纵希拉里搜索结果,技术真相揭秘

转自: 新智元

谷歌被指操纵美国总统候选人希拉里搜索结果,技术真相揭秘

日前,谷歌被指涉嫌操纵搜索结果,屏蔽对希拉里·克林顿搜索负面关键词,为希拉里选举造势。新智元跟进调查认为,仅凭目前给出的证据不足以推论谷歌操纵了搜索希拉里时的关键词提示,根据我们自己的测试以及相关文章,有很大的把握相信,谷歌的确对搜索提示词做了处理,但并没有专门针对与希拉里有关的搜索内容做手脚。

美东时间,6月9日下午,一则短视频在Youtube上被疯狂转发。

知名博客SourceFed在视频中指出Google涉嫌人为操纵搜索结果,为希拉里选举造势。

视频中举出的例证是,查询 hillary clinton crimes(希拉里犯罪)时,键入 hillary clinton cri,出来的自动联想词是:

谷歌被指操纵美国总统候选人希拉里搜索结果,技术真相揭秘

在谷歌的搜索栏中输入“Hillary Clinton cri”,建议的搜索关键词包括希拉里的犯罪改革、危机,以及与犯罪相关的法案,而没有包含“希拉里犯罪”在内。然而,视频发布时,SourceFed查询谷歌的统计数据显示,相对于谷歌建议的关键词,“希拉里犯罪”的搜索流量更高。

此外,视频中还有用“Hillary Clinton ind”,其实是想搜索“hillary clinton indictment”,因为此前希拉里曾用私人邮箱收发公文,由此引发的“电邮门”还在酝酿之中,但谷歌给出的建议搜索关键词包括“希拉里·克林顿印第安纳”、“希拉里·克林顿印度”,而没有“希拉里·克林顿起诉”。当然,在SourceFed发布该视频时,与刚才cri 的搜索一样,在Google Trend 中,indictment 的搜索量也远远大于Indiana 和 Indian。

视频还表示,在雅虎和必应搜索同样的关键词,这两个搜索引擎给出的自动联想词,优先选项都是“希拉里+罪名”(hillary clinton crimes):

谷歌被指操纵美国总统候选人希拉里搜索结果,技术真相揭秘

由此,SourceFed 称,谷歌涉嫌操纵搜索结果,屏蔽对希拉里还负面影响的搜索关键词,以此来影响美国竞选。

此闻一出,舆论哗然。

有评论称:谷歌不收钱这么干,纯粹出于对希拉里政治理念的认同,那也有公器私用之嫌——它占据了美国搜索市场的六成,其一举一动,都在潜移默化地影响民众的三观。

谷歌被指操纵美国总统候选人希拉里搜索结果,技术真相揭秘

微信公众号“大米社群”的相关文章中指出:搜索引擎的竞价排名有违道德,侵害了民众的知情权;对政客的形象公关,也是对民众知情权的侵害。

微信公众号“北美留学生”发布的相关文章指出:在现阶段来说,如果谷歌真的在搜索结果中进行人工干预从而试图影响美国大选,他们这么做虽然不道德,但是不违法;目前没有没有任何一条法律指明搜索引擎公司不允许人工操纵搜索结果;但是,几乎所有人都明白,如果谷歌真的开始操纵搜索结果,会造成空前的影响,几乎可以直接影响最后大选的结果。

那么,谷歌对此的回应又是如何呢?

谷歌:有修改关键词提示,但没有操纵搜索结果

对此,谷歌在公告中表示:“谷歌的关键词自动完成功能没有倾向于任何候选人。相反的看法误解了关键词自动完成功能的工作方式。”

谷歌表示,自动完成功能中显示的关键词不会包括具有攻击性、侮辱性的词汇。了解该功能的消息人士表示,“犯罪(crime)”属于具有攻击性的词汇。此外,软件做出的建议会基于多种影响因素,包括用户的搜索历史和位置,而不仅仅是搜索流量。

谷歌发言人的声明:“谷歌的自动搜索建议并不会支持任何一位候选人或者事件。对谷歌自动搜索建议的指控纯粹误解了自动搜索建议的工作原理。当与人名联系在一起时,我们的搜索引擎不会自动建议冒犯的或者毁谤的问题。大体上,我们的自动搜索建议是基于一系列不同的因素提供的,其中包括搜索词语的热度。”

但是,对于谷歌这样的回应,并不能平复人心。有中国读者在看完 SouceFed 视频后回复称:

修改关键词提示 ≠ 操纵搜索结果

昨天,谷歌搜索的元老——Matt Cutts在推特上作出了回应,称这种指责是“低级错误”。

谷歌被指操纵美国总统候选人希拉里搜索结果,技术真相揭秘

SourceFed视频中的两个例子是:搜索“hillary clinton in” 不会出现 “hillary clinton indictment”的搜索建议,输入“hillary clinton cri”也不会出现crime这个相关词。

但是,其实大多数人搜索关于希拉里的负面新闻的时候,会搜“希拉里怎么样”而不是搜“希拉里·克林顿怎么样”(hillary X not hillary clinton X)。

谷歌被指操纵美国总统候选人希拉里搜索结果,技术真相揭秘

搜索 hillary in 的结果,就自动建议indictment。

谷歌被指操纵美国总统候选人希拉里搜索结果,技术真相揭秘谷歌被指操纵美国总统候选人希拉里搜索结果,技术真相揭秘

hillary cr 的更多搜集建议

谷歌被指操纵美国总统候选人希拉里搜索结果,技术真相揭秘

Cutts问了谷歌的PR,视频发布者在将视频放到网上前,并没有对谷歌进行求证。

Cutts 指出:这是一个技术高度发达的时代,为什么在做这样一个充满指责的长视频前,不去做一些更深入的研究。

Medium 上,数字营销公司 OutSpoken CEO Rhea Drysdale 也撰文表示,谷歌并没有操纵搜索结果来为自己服务。

Drysdale 在文中以 Trump 的搜索结果为例——Donald Trump 曾被曝出在离婚期间强奸妻子 Ivana Trump。虽然作为当事人的Ivana否定了这一说法,但是这起事件确实也见诸新闻报道,并且有许多人都在搜索。

Drysdale 文中表示,如果你在谷歌搜索“Donald Trump ra-”,也不会出现任何关于“rape”(强奸)的建议,最多的建议是“rally”(集会)。但是去年,搜索“Donald Trump rape”的人显然比“Donald Trump rap”要多。

谷歌被指操纵美国总统候选人希拉里搜索结果,技术真相揭秘

Drysdale 给出在谷歌搜索 Trump rape 当中 Trump ra 的结果

谷歌被指操纵美国总统候选人希拉里搜索结果,技术真相揭秘

Drysdale 给出证据:搜索 trump rape 的次数明显比 trump rap 的要多。

Drysdale 就指出,依照SourceFed的逻辑,谷歌肯定也支持 Trump。

因此,并不能以此就定论谷歌在操作搜索结果,支持希拉里一方。

Drysdale表示,指控谷歌的这段视频之所以得到广泛传播是由于,美国人对总统大选感到担忧。

新智元调查结果

谷歌搜索由一系列复杂的算法组成,以多种方式呈现信息,其中包含了大量的人工智能技术。

谷歌的自动搜索建议受用户行为、个性化、趋势和其他许多因素影响。

1. Google 的搜索提示会 (在已输入内容是人名时) 刻意隐藏某些负面字眼,比如 crime、murder、rape 等,即便搜索那些历史上臭名昭著的罪犯的名字也不会立即提示 (当然,不排除他们的算法存在漏网之鱼的情况,所以这个不是绝对的);

2. 搜索提示的内容与 Google trends 的内容没有必然关系,前者是 Google 对搜索者的建议,这种建议必然要考虑到各种因素,比如“社会的公序良俗”之类的东西,以及搜索提示对某些人群的冒犯可能引起的法律纠纷,而后者只是客观描述全体搜索者的行为,不需要考虑这些东西;

3. 当人们搜索希拉里时,一般是采用 hillary + 关键词的形式,而不是希拉里全名 hillary clinton + 关键词的形式,但那个视频没有尝试这种情况,并且现在输入 hillary in 的确会得到 hillary indictment 的提示(例证见下图);

4. 目前再去搜索那篇文章中提到的关键词,得到的结果 (搜索提示以及Google trends) 已经不可避免地被“那篇文章的疯传引发的人们对这些关键词的大量尝试”影响了。

这起事件表明,谷歌等科技公司在人们获取新闻和信息的过程中正扮演越来越重要的角色。谷歌以“不作恶”为公司座右铭,并一直宣称搜索引擎坚持客观公正。但近几年,外界一直对谷歌有类似上述指控。

与谷歌事件类似,就在上个月,Facebook也调整了“趋势话题”的排序方式。一些前员工表示,Facebook在选择“趋势话题”时有不利于保守派的倾向。Facebook对这一指控表示否认。

CognitiveSEO CEO Razvan Gavrilas指出,谷歌一直坚称关键词自动完成功能会排除侮辱性词汇或成人词汇,但该公司并不会操纵特定搜索结果。他表示:“我很难相信,谷歌会人工调整自动完成的结果。如果这样做,那么将是与他们到目前为止的业务道德背道而驰。”

SourceFed发言人目前尚未对此置评。

综上,仅凭目前给出的证据,不足以推论谷歌操纵了输入希拉里时的搜索关键词提示,根据相关文章以及我们自己的测试,有很大的把握相信,谷歌的确对搜索提示词做了相关处理,但并没有专门针对与希拉里有关的搜索内容做手脚。

消息来源:

  1. http://www.businessinsider.com/google-says-no-altered-hillary-clinton-search-results-2016-6

  2. http://www.vox.com/2016/6/10/11903028/hillary-clinton-google-debunked

  3. https://medium.com/@rhea/hillary-clintons-search-results-manipulated-by-sourcefed-not-google-3dd9a5c68ca1

  4. 北美留学生报:震惊!谷歌涉嫌操纵搜索结果来支持希拉里,纸牌屋剧情现实版

  5. 大米社区:谷歌被曝操纵搜索结果支持希拉里,纸牌屋现实版or阴谋论?