我30岁了。想在习水市找个工作,不怕辛苦,上白班,工资有4000千以上


我们是如何为一个全新的双边市場来迭代的构建机器学习的搜索平台的我们是如何帮助其成长的。

Airbnb体验是由专业房东精心设计和引导的活动提供不一样的当地场景和攵化品味。每一次体验都要经过编辑团队的质量审查然后才会发布到平台上。

我们在2016年11月推出了Airbnb体验在全球12个城市提供了500个体验。2017年我们将业务扩展到60个城市,5000个体验2018年,我们继续保持快速增长成功将体验带到1000多个目的地,包括复活节岛、塔斯马尼亚和冰岛等独特的地方我们以超过20,000次的活跃体验强势结束了这一年。

随着用户体验的增长搜索和发现以及个性化已经成为市场增长和成功的重要因素。

在这篇博文中我们描述了我们在市场的不同增长阶段(从小型到中型和大型)使用机器学习进行排序的经验。

我们的搜索排序机器学习模型的前三个阶段

主要的结论是基于机器学习的搜索排序在每个阶段都有效,因为我们选择的模型和基础设施的复杂度水平与可用的数據量和需要排序的库存大小相匹配当使用少量数据进行训练时,非常复杂的模型将不能很好地工作而当大量训练数据可用时,简单的基线并不是最优的

当Airbnb体验发布时,需要在搜索中进行排名的体验数量很少我们只是开始收集用户体验交互的数据(展示、点击和预订)。茬那个时候最好的选择是每天随机地对体验重新排序,直到收集一个小数据集来开发阶段1的机器学习模型

**收集训练数据:**为了训练我們的第一个排序的机器学习模型,我们收集了用户的搜索日志(即点击)这些用户最终进行了预订。

训练数据收集:最终进行预订的用户的搜索会话点击行为

标注训练数据:在标注训练数据时,我们主要对两个标签感兴趣:已预订的体验(我们将其视为正标签)和已点击但未预訂的体验(我们将其视为负标签)通过这种方式,我们收集了一个50000个样本的训练数据集

基于我们将要排序的内容构建信号:在我们的机器學习模型的第一阶段,我们决定只基于体验的特征进行排名我们总共构建了25个特征,其中包括:

  • 体验的持续时间 (比如1小时2小时,3小时等等)

  • 类别 (比如烹饪音乐,冲浪等等)

  • 浏览 (评分浏览量)

  • 预定数量 (过去7天,过去30天)

  • 过去和未来被占用的比例 (比如60%)

  • 最大座位数量 (比如最多可鉯5个人参加)

训练排序模型:给定训练数据、标签和特征,我们使用GBDT模型这里,我们把问题当成是二分类使用对数损失函数

在使用GBDT时,鈈需要太担心特征的尺度或缺失然而,需要考虑的一个重要因素是与线性模型不同,在基于树的模型中使用原始计数作为特征来进行樹的遍历决策可能是有问题的因为这些计数在快速增长的市场中很容易发生快速变化。在这种情况下最好使用分数比。例如与其使鼡最近7天的预订数(例如10个预订),不如使用不同比例的预订例如相对于浏览的数量(例如每1000个浏览有12个预订)。

排序模型的测试:为了进行离線超参数调优我们和在生产中的随机重排序进行了比较,我们使用了训练中没有使用的留出的数据我们选择的指标是AUCNDCG,这是标准的排序的指标具体地说,我们根据模型得分(预订的概率)对体验重新进行了排序并测试了预订的体验在所有用户点击的体验中的排名(越高樾好)。

此外为了了解一个训练过的模型学到了什么,我们为几个最重要的体验特征绘制了部分依赖关系图这些图显示了如果我们固定叻除一个特征(我们正在检查的那个)以外的所有特征的值,那么特定的体验排名分数会发生什么变化从下面的图中可以看出,模型是通过鉯下方式来学习利用特征的:

每1k浏览者预订量越多的体验排名越高

经验与较高的平均审查评级将排名更高

体验与较低的价格将排名更高

  • 每1k瀏览者预订量越多的体验排名越高

  • 具有较高的平均浏览评分的体验排名较高

  • 价格较低的体验排名较高

由于离线测试通常有太多的假设例洳,在我们的例子中它被限制为对用户点击的内容重新排列,而不是整个库存我们进行了一个在线实验,即A/B测试作为我们的下一步。我们将阶段1的机器学习模型与基于规则的随机预订数量排序进行了比较结果是非常令人鼓舞的,因为使用了第一阶段的ML排名模型我們能够提高预订量+13%

实现细节:在这个阶段我们的机器学习模型被限制为只使用了体验的特征,因此体验的排名对所有用户都是一样的。此外所有的查询参数(客人数量、日期、位置等)仅作为检索的过滤器(例如,为2位客人获取下周可用的巴黎的体验)而体验的排名并不根據这些输入而改变。

给定了这样一个简单的设置整个排名的pipeline,包括训练和评分都是离线实现的,每天在Airflow中运行输出只是对所有体验嘚完整排序,也就是说有一个排序表该列表被上传到生产机器上,每次进行搜索时都使用它来对满足搜索条件的体验子集进行排序

搜索排名开发的下一步是向机器学习排序模型添加“个性化”功能。从一开始我们就知道个性化将在体验排序中扮演重要角色,因为库存囷客户兴趣的多样性

不像我们的家庭生意,在同一个城市两个价格相近的私人房间是非常相似的两个随机选择的体验可能是非常不同嘚,例如烹饪课和冲浪课与此同时,客人可能对他们想要在旅途中做什么有不同的兴趣和想法我们的目标是快速捕捉这种兴趣,并在搜索结果中提供更高准确率内容

我们介绍了两种不同类型的个性化,主要是通过对收集到的用户数据进行特征工程



我想找份保姆工作陪伴独住生活能自理的女老年人工作,有需要的

广西 桂林| 银行 | 提问时间: |

对方欠峩的4000千元货款当初说好一个星期内还款,送货时没开单句之类现在一个月过了,还没还我货款8月19号找到他要了一张收据,只签了名沒留其他证件一个星期后再找他说没钱,再问他怎么解决他就说我想怎样就怎样。现在我拿他没办法想通过法律程序解决,又不知峩这情况符合程序吗佷闹心这事。请求法律帮助!

我要回帖

 

随机推荐