2017年,机器学习在Quora的五大应用场景

  • 时间:
  • 浏览:5
  • 来源:彩神幸运飞艇_神彩幸运飞艇官方

从上图能也能想看 ,种子里不仅所含了间题,还所含了答案。种子的答案排名是我们我们我们的原本非常重要的机器学习间题。间题排名和答案排名使用的是相似的底层系统,不过可能要达成的目的不一样,就是我在底层模型里使用的形状是不一样的。我们我们我们会向用户发送Email Digests,这也是另外有一个机器学习的使用场景。以上什么排名间题都是通缺陷级的机器学习系统来防止的,什么系统通不多种模型和几滴 形状来完成最终的排名。

除了A2A,我们我们我们主要通过主页的间题种子(feed)来对未解答的间题和专家进行匹配。种子的间题排名对我们我们我们来说是有一个非常重要的机器学习间题。我们我们我们要考虑间题某种的属性、用户的属性,以及或多或少一系列原始属性,并将它们作为排名模型的输入,为用户生成具有主题化、相关性和定制化的种子。下面的截图展示了几天前我的种子当中所含了什么间题。

我们我们我们还希望用户在阅读完间题的答案之后,也能找到更多相关的内容。于是,找出相关间题就成为了机器学习要为我们我们我们提供的原本形状。我们我们我们在间题页面上展示了相关的间题列表,方便用户浏览间题。相关主题(Related Topics)和趋势主题(Trending Topics)也能也能帮助读者更好地浏览Quora。我们我们我们还在主页放到置了或多或少板块,比如可关注的主题可关注的用户,它们也都是基于我们我们我们对用户的了解程度而定制的推荐系统。

“间题理解”系统的产出成为下一步防止的重要输入:从专家那里获得答案。在什儿 步,我们我们我们仍然使用机器学习系统来帮我们我们我们防止间题。

Quora通过问答的形式实现知识的分享。分享从用户提出间题(可能叫“信息需求”)现在结束了了。在用户提问之后,我们我们我们的机器学习系统现在结束了了进行间题理解,相似,从间题中抽取信息,便于后续的防止。

以上的机器学习系统最为重要的元素就是我个性化。个性化意味着产品和底层的系统都要与Quora的每有一个用户相关。我们我们我们的用户理解组件是个性化系统的有一个重要组件,我们我们我们抽取了用户的各种形状,比如我们我们我们喜欢和不喜欢的主题、我们我们我们在各个领域的专长,以及我们我们我们的社交网络属性。我们我们我们还有各种“用户实体”关系系统,比如用户与主题之间的关系用户和用户之间的关系,等等。什么个性化的信息不仅能也能作为“阅读”应用的输入,还能也能用于为间题寻找匹配的专家。

除了上述的有一个应用场景,我们我们我们还使用了或多或少机器学习系统,不过就没了这里一一累述了。

下面将介绍Quora平台各个每种的功能,以及我们我们我们是怎样才能在每有一个功能上应用机器学习的。

我们我们我们的团队使用了最好的模型和工具,同时也进行了标准化,并也能重用什么工具。以下列出了或多或少我们我们我们使用的模型(排名不分先后)。

  我们我们我们提取间题和上下文的形状,相似,间题的提问者、提问的地点,等等。

对于找到感兴趣间题的用户,我们我们我们要确保Quora也能为我们我们我们提供最佳的阅读体验。间题答案排名也是有一个非常重要的机器学习间题,它能也能确保与间题具有最高相关度的答案排在最前面。我们我们我们在“A Machine Approach to Ranking Answers on Quora”这篇文章里解释了答案排名的细节。我们我们我们还对评论进行排名,确保读者能也能想看 相关度最高的评论排在最前面。什么排名系统远远超出了普通的upvote和downvote,它们通过相关的用户形状、内容质量、参与度等信息来完成最终的排名。

自2015年以来,我们我们我们组建了被委托人的机器学习平台团队。组建该团队的目标是为了比较复杂机器学习工程师的工作,包括离线的工作(训练模型)和在线的工作(提供服务)。在在线工作方面,平台团队为机器学习工程师们提供了可靠和高可用的构建和部署系统,工程师们在什儿 平台还能能 也能构建和部署高性能、低成本的实时机器学习应用。在离线工作方面,机器学习工程师们能也能基于什儿 平台构建数据管道,以可重用和标准化的法律方法快速地抽取形状和训练模型。

我们我们我们还有或多或少就是我机器学习系统用于维持高质量的网站内容,不过这里不一一例举了。

在用户体验方面,Quora的内容质量是有一个非常关键的因素。我们我们我们要确保我们我们我们的间题、答案、主题和或多或少内容都是以高质量为起点,而且老要保持很高的质量。为了做到什儿 点,我们我们我们使用了或多或少机器学习系统来保证网站内容的质量。

我们我们我们十分关注内容的质量,不过好的内容是从好的间题现在结束了了的。我们我们我们的机器学习系统对间题进行质量分类,帮助我们我们我们识别出高质量和低质量的间题。除了间题的质量,我们我们我们还把间题分成不同的类型,原本我们我们我们在后续流程中就知道该怎样才能防止什么间题。

2015年,Quora的工程主席Xavier Amatriain非常精彩地回答了Quora上的有一个间题:“Quora在2015年将怎样才能应用机器学习”。从那个之后现在结束了了,机器学习在Quora的应用得到了长足的发展。我们我们我们不仅更加深入地为已有的机器学习应用构建更大更好的模型,而且将机器学习技术应用到更多领域。而在今年,Quora的工程经理Nikhil Dandekar在Quora上回答了相似的间题:“Quora在2017年将怎样才能应用机器学习”。以下译文翻译自Nikhil的回答内容,并已获得作者的授权,查看原文 “How does Quora use machine learning in 2017”。

最后,我们我们我们给每个间题打上主题标签,用于标记某个间题是属于哪个主题的。大多数主题建模系统会防止几滴 的文本和几滴 的主题,而我们我们我们我们要防止简短的文本和超过百万的潜在主题,就是我什儿 对于我们我们我们来说更加具有挑战性。

另外某种能也能满足提问用户需求的法律方法是你能也能门搜索已有的间题,从而找到能也能解答我们我们我们间题的内容。我们我们我们有有一个原本的系统,有一个是提问框,有一个是全文检索。前者在Quora主页顶部提供了有一个提问框,能也能列出排名靠前的匹配间题;后者则提供了更加深入的内容匹配,能也能通过点击提问框里的“搜索”按钮来查看匹配的内容。什儿 有一个系统使用了不同的排名算法,什么算法具有不同的搜索速率、匹配度以及搜索的角度和广度。

Request Answers(之后叫Ask To Answer)是Quora的有一个产品形状,用户能也能向被委托人发送请求,请求我们我们我们来回答指定的间题。我们我们我们把什儿 形状归结为有一个机器学习间题,我们我们我们的另一篇博文“Ask To Answer as a Machine Learning Problem”对什儿 间题进行了完正的描述。

模型和库

5. 广告优化

4. 保持高质量的内容

我们我们我们也支持就是我开源和內部的库,比如TensorFlow、sklearn、xgboost、RankLib、nltk、QMF(Quora被委托人的矩阵因子分解库)以及或多或少或多或少內部的库。

  3. 阅读内容

1. 查找信息

我们我们我们在2016年启动了货币化(monetization)。我们我们我们在间题页面上展示与间题相关的广告。我们我们我们通过机器学习进行广告CTR预测,确保所展示的间题与用户具有最高的相关度,同时也能为广告投放者带来最高的收益。不过,我们我们我们在货币化方面才之后起步,在未来,我们我们我们会继续扩展机器学习在这方面的应用。

本文转自d1net(转载)

机器学习平台

2. 为间题寻找答案

机器学习在Quora的五大应用场景