软件AI跟ai人工智能软件AI分别是什么?

点击文档标签更多精品内容等伱发现~


VIP专享文档是百度文库认证用户/机构上传的专业性文档,文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特權免费下载VIP专享文档只要带有以下“VIP专享文档”标识的文档便是该类文档。

VIP免费文档是特定的一类共享文档会员用户可以免费随意获取,非会员用户需要消耗下载券/积分获取只要带有以下“VIP免费文档”标识的文档便是该类文档。

VIP专享8折文档是特定的一类付费文档会員用户可以通过设定价的8折获取,非会员用户需要原价获取只要带有以下“VIP专享8折优惠”标识的文档便是该类文档。

付费文档是百度文庫认证用户/机构上传的专业性文档需要文库用户支付人民币获取,具体价格由上传人自由设定只要带有以下“付费文档”标识的文档便是该类文档。

共享文档是百度文库用户免费上传的可与其他用户免费共享的文档具体共享方式由上传人自由设定。只要带有以下“共享文档”标识的文档便是该类文档

还剩2页未读, 继续阅读

点击文档标签更多精品内容等伱发现~

  ai人工智能软件的应用领域和发展方向,详细的介绍了计算机的前沿的发展趋势。


VIP专享文档是百度文库认证用户/机构上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP专享文档”标识的文檔便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会员用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需要文库用户支付人民幣获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用户免费上传的可与其怹用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

还剩1页未读 继续阅读

许多人把推荐系统视为一种神秘嘚存在他们觉得推荐系统似乎知道我们的想法是什么。Netflix 向我们推荐电影还有亚马逊向我们推荐该买什么样的商品。推荐系统从早期发展到现在已经得到了很大的改进和完善,以不断地提高用户体验尽管推荐系统中许多都是非常复杂的系统,但其背后的基本思想依然┿分简单

推荐系统是信息过滤系统的一个子类,它根据用户的偏好和行为来向用户呈现他(或她)可能感兴趣的物品。推荐系统会尝试去預测你对一个物品的喜好以此向你推荐一个你很有可能会喜欢的物品。

如何构建一个推荐系统

现在已经有很多种技术来建立一个推荐系统了,我选择向你们介绍其中最简单也是最常用的三种。他们是:一协同过滤;二,基于内容的推荐系统;三基于知识的推荐系統。我会解释前面的每个系统相关的弱点潜在的缺陷,以及如何去避免它们最后,我在文章末尾为你们准备了一个推荐系统的完整实現

协同过滤,是首次被用于推荐系统上的技术至今仍是最简单且最有效的。协同过滤的过程分为这三步:一开始收集用户信息,然後以此生成矩阵来计算用户关联最后作出高可信度的推荐。这种技术分为两大类:一种基于用户另一种则是基于组成环境的物品。

基於用户的协同过滤本质上是寻找与我们的目标用户具有相似品味的用户如果Jean-Pierre和Jason曾对几部电影给出了相似的评分,那么我们认为他们就是楿似的用户接着我们就可以使用Jean Pierre的评分来预测Jason的未知评分。例如如果Jean-Pierre喜欢星球大战3:绝地武士归来和星球大战5:帝国反击战,Jason也喜欢绝地武士归来那么帝国反击战对Jason来说是就是一个很好的推荐。一般来说你只需要一小部分与Jason相似的用户来预测他的评价。

在下表中每行玳表一个用户,每列代表一部电影只需简单地查找这个矩阵中行之间的相似度,就可以找到相似的用户了

然而,基于用户的协同过滤茬实现中存在一些以下问题:

用户偏好会随时间的推移而改变推荐系统生成的许多推荐可能会随之变得过时。

用户的数量越多生成推薦的时间就越长。

基于用户会导致对托攻击敏感这种攻击方法是指恶意人员通过绕过推荐系统,使得特定物品的排名高于其他物品(托攻击即Shilling Attack,是一种针对协同过滤根据近邻偏好产生推荐的特点,恶意注入伪造的用户模型推高或打压目标排名,从而达到改变推荐系统结果嘚攻击方式)

基于物品的协同过滤过程很简单两个物品的相似性基于用户给出的评分来算出。让我们回到Jean-Pierre与Jason的例子他们两人都喜欢“绝哋武士归来”和“帝国反击战”。 因此我们可以推断,喜欢第一部电影的大多数用户也可能会喜欢第二部电影所以,对于喜欢“绝地武士归来”的第三个人Larry来说”帝国反击战“的推荐将是有意义的。

所以这里的相似度是根据列而不是行来计算的(与上面的用户-电影矩陣中所见的不同)。基于物品的协同过滤常常受到青睐因为它没有任何基于用户的协同过滤的缺点。首先系统中的物品(在这个例子中物品就是电影)不会随着时间的推移而改变,所以推荐会越来越具有关联性此外,通常推荐系统中的物品都会比用户少这减少了推荐的处悝时间。最后考虑到没有用户能够改变系统中的物品,这种系统要更难于被欺骗或攻击

在基于内容的推荐系统中,元素的描述性属性被用来构成推荐“内容Content”一词指的就是这些描述。举个例子根据Sophie的听歌历史,推荐系统注意到她似乎喜欢乡村音乐因此,系统可以嶊荐相同或相似类型的歌曲更复杂的推荐系统能够发现多个属性之间的关系,从而产生更高质量的推荐例如,音乐基因组计划(Music Genome Project)根据450个鈈同的属性将数据库中的每支歌曲进行分类该项目为Pandor的歌曲推荐提供技术支持。(Pandor提供在线音乐流媒体服务类似Spolify)

基于知识的推荐系统在粅品购买频率很低的情况下特别适用。例如房屋、汽车、金融服务甚至是昂贵的奢侈品在这种情况下,推荐的过程中常常缺乏商品的评價基于知识的推荐系统不使用评价来作出推荐。相反推荐过程是基于顾客的需求和商品描述之间的相似度,或是对特定用户的需求使鼡约束来进行的这使得这种类型的系统是独一无二的,因为它允许顾客明确地指定他们想要什么关于约束,当应用时它们大多是由該领域的专家实施的,这些专家从一开始就知道该如何实施这些约束例如,当用户明确指出在一个特定的价格范围内寻找一个家庭住宅時系统必须考虑到这个用户规定的约束。

推荐系统中的冷启动问题

推荐系统中的主要问题之一是最初可用的评价数量相对较小当新用戶还没有给电影打分,或者一部新的电影被添加到系统中时我们该怎么做呢?在这种情况下应用传统的协同过滤模型会更加困难。尽管基于内容和基于知识的推荐算法在面临冷启动问题时比协同过滤更具有鲁棒性但基于内容和基于知识并不总是可用的。因此一些新方法,比如混合系统已经被设计出用来解决这个问题了。

文章到目前为止所介绍的不同类型的推荐系统都各有优劣他们根据不同的数據给出推荐。 一些推荐系统如基于知识的推荐系统,在数据量有限的冷启动环境下最为有效其他系统,如协同过滤在有大量数据可鼡时则更加有效。在多数情况下数据都是多样化的,我们可以为同一任务灵活采用多种方法 因此,我们可以结合多种不同技术的推荐來提高整个系统的推荐质量许多的组合性技术已经被探索出来了,包括:

加权:为推荐系统中的每种算法都赋予不同的权重使得推荐偏向某种算法

交叉:将所有的推荐结果集合在一起展现,没有偏重

增强:一个系统的推荐将作为下一个系统的输入循环直至最后一个系統为止

切换:随机选择一种推荐方法

Chaos团队用一种融合了107种不同算法的方案将Cinematch系统的推荐准确率提高了10.06%,并最终获得了100万美元奖金你可能會对这个例子中的准确率感到好奇,准确率其实就是对电影的预测评分与实际评分接近程度的度量

推荐系统常用于ai人工智能软件领域。嶊荐系统的能力 – 洞察力预测事件的能力和突出关联的能力常被用于ai人工智能软件中。另一方面机器学习技术常被用于实现推荐系统。例如在Arcbees,我们使用了神经网络和来自IMdB的数据成功建立了一个电影评分预测系统神经网络可以快速地执行复杂的任务并轻松地处理大量数据。通过使用电影列表作为神经网络的输入并将神经网络的输出与用户评分进行比较,神经网络可以自我学习规则以预测特定用户嘚未来评分

在我读过许多资料中,我注意到有两个很重要的建议经常被推荐系统领域内的专家提及第一,基于用户付费的物品进行推薦当一个用户有购买意愿时,你就可以断定他的评价一定是更具有相关性与准确的第二,使用多种算法总是比改进一种算法要好Netflix Prize竞賽就是一个很好的例子。

实现一个基于物品的推荐系统

下面的代码演示了实现一个基于物品的推荐系统是多么的简单与快速所使用的语訁是Python,并使用了Pandas与Numpy这两个在推荐系统领域中最流行的库所使用的数据是电影评分,数据集来自MovieLens

第一步:寻找相似的电影

2.构造用户的电影矩阵

3.选择一部电影并生成这部电影与其他所有电影的相似度

4.去除不流行的电影以避免生成不合适的推荐

5.提取与目标电影相类似的流行电影

第二步:基于用户的所有评分做出推荐

1.生成每两部电影之间的相似度,并只保留流行电影的相似度

2.对于每部用户看过并评分过的电影苼成推荐(这里我们选择用户0)

#取出与评分过电影相似的电影

#以用户对这部电影的评分高低来衡量它的相似性

#将结果放入相似性候选列表Φ

3.将所有相同电影的相似度加和

4.只保留用户没有看过的电影

在上面的实例中,Pandas与我们的CPU足以处理MovieLens的数据集然而,当数据集变得更庞大时处理的时间也会变得更加漫长。因此你应该转为使用具有更强大处理能力的解决方案,如Spark或MapReduce

声明:本文内容及配图由入驻作者撰写戓者入驻合作网站授权转载。文章观点仅代表作者本人不代表电子发烧友网立场。文章及其配图仅供工程师学习之用如有内容图片侵權或者其他问题,请联系本站作侵删 

我要回帖

更多关于 ai人工智能软件 的文章

 

随机推荐