对于'用户-物品'矩阵,可以利用非空项的数据来预测空白项的数据,即预测用户对于其未接触到的物品的评分,并根据预测情况,将评分高的物品推荐给用户。预测评分的方式有很多,矩阵分解是一种非常适合的方法。

用户协同过滤并不总是合适的。为了解决用户协同过滤的缺陷,于是又有了物品协同过滤(ItemCF)。ItemCF 的原理是,为用户推荐那些和他之前喜欢的物品相似的物品。例如,算法可能会因为用户买过《推荐系统实践》而为用户推荐《推荐系统》。

用户协同过滤一般是在海量的用户中发掘出一小部分和目标用户品位比较类似的,然后根据他们喜欢的其他东西组织成一个排序的目录作为推荐给目标用户。

基于内容的推荐算法理论依据主要来自于信息检索和信息过滤,是最早被使用的推荐算法,它的思想非常简单:根据用户过去喜欢的物品(item),为用户推荐和他过去喜欢的物品相似的物品。

大数据时代产生了海量的数据,数据对企业来说是一种隐形的资产,里面蕴含了丰富的价值。但是,大数据体量之大、种类之繁以及产生速率之快,海量的数据并不都是有价值的,用户从海量的数据中提取有用的、针对性的信息需要花费很大的时间成本。比如,当你面对如此多的电影列表,你想找到一部最符合自己兴趣的电影,因为电影数量之多,你不可能把所有的电影简介都看一遍。那么怎么解决这个问题呢?电影平台搜集你过去看过的全部电影,分析了解你对什么类型电影感兴趣,然后针对性的把你感兴趣的电影主动的罗列给你,你不用花费太多的精力便可快速找到满足自己需求的电影。推荐系统便是为解决这类实际需求而诞生了。

Neo4j是一个图数据库,配合networkx可以完成较为复杂网络的分析工作。

networkx是用python下开发的图论和复杂网络建模工具,内置了常用的图和复杂网络分析算法,可以方便的进行复杂网络数据分析、仿真建模等工作。

中心性算法(centrality algorithm)用于理解图中特定节点的角色及其对网络的影响。
0%