我正在考虑向TalkingPuffin Twitter客户端添加一项功能,在与用户进行一些培训后,它可以根据预测值对传入的推文进行排名. Java虚拟机(Scala或Java首选)有哪些解决方案来执行此类操作?
解决方法:
做好这件事并不容易.谷歌希望能够做到这样的事情(“用户会有什么样的联系价值”),Netflix(“他们会重视什么电影”)和其他许多人.事实上,你可能会阅读有关winning entry for the Netflix Prize的说明.
然后你需要提取一堆功能,正如@hmason所说.然后你需要一个合适的机器学习算法;你需要一个函数近似器(你试图使用你的功能来预测0和1之间的值,其中1是“最好的推文”,0是“omg who cares”)或分类器(你使用的地方)你的功能,试图预测它是一个“好”或“坏”的推文).
如果你选择后者 – 这使得用户培训变得容易,因为他们只需要用“喜欢”(混合社交网络隐喻)来获得推文 – 那么你通常最好使用支持向量机,其中存在一个fairly comprehensive Java library.
在前一种情况下,有许多技术可能值得尝试;如果您决定使用LIBSVM库,它们也有回归变量(即参数估计).
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。