当前位置 主页 > 行业动态 >

,hg0088皇冠:如何保持社区质量、文明

  

有些答案是比其他人更有用,所以对我们来说是非常重要的为读者提供最好的答案为了了解答案的质量。要做到这一点,我们需要得分Quora上所有的答案,和标准的基于很多主观评分,包括写作风格、可读性,诚信、信誉。因为Quora是一个全球性的社区,人们分享和吸收世界的智慧,所以我们希望人们与不同级别的英语写Quora上。通过NLP,我们可以自动提高文本的语法,使它更容易阅读的前提,意思是恒定的。问题质量人在Quora问各种各样的问题。其中一些问题很容易阅读,其他人则没有。一些非常具体的问题,有些问题是更广义。一些问题有一个单独的和客观的回答,其他人将会导致一个主观的讨论。

重要的是对于我们理解的质量(和许多其他特性)的问题发送到我们的质量和相关性系统。重复检测到一个相同的意思是不断重复的问题很多时候真的是一个令人沮丧的事情,读者必须看到很多页找到答案,和受访者也有一个问题回答很多次了。然而,我们希望任何意义Quora只有一个相同的问题和规范的问题。为了实现这一目标,我们需要能够预测是否一个新的问题已经在其他形式存在于Quora,并检测重复问题。考虑Quora上数以百万计的问题,重复检测问题是一定会是一个非常具有挑战性的问题,而且在用户实时当被要求这样做,这样做,难度就更大了。

成千上万的人使用Quora找到重要问题的答案。我们的内容的质量和在社区的文明程度的两个重要因素使Quora特别。我们想继续保持这种品质即使数十亿人开始使用Quora。在Quora,我们获得了大量的文本数据由hg0088皇冠数以百万计的问题,答案和评论。我们还需要补充的文本语料库巨大的元数据,包括用户的历史“是”和“反对”,用户感兴趣的主题和专业知识问题主题和主题本体(主题本体映射用户的社会效应,和quora的用户行为。

这样一个丰富的数据让我们可以用在多种自然语言处理(NLP:自然语言处理)技术来解决这个令人兴奋,有关我们的成功,让我们在一个独特的位置。本文进行总结后的NLP挑战我们最重要的一个广泛的领域:与我们的经济增长,维护和提高我们的内容质量的内容提供了更多的结构,使搜索更容易使我们的社区安全知识和文明的下面我们将这些挑战更深入的理解,并将在以后的文章中介绍了不同类型的NLP的挑战。在Quora回答质量,你可以找到最好的回答任何问题。相关问题产生在我们的问题的答案,我们经常想找到答案相关的后续问题。同样的事情也发生在Quora——人们喜欢发现新的内容相关的问题。对于一个给定的问题,这是一个非常具有挑战性的NLP问题Quora上找到最相关的问题,特别是因为重复之间的边界问题和相关问题往往非常狭窄。

本文来源:http://www.myjdgc.com成都铭月机电工程有限公司