搜索 | 会员  
  • OPPO积累了大量的数据,上图右边是整体数据规模的演进:从2012年开始每年都是2~3倍的增长速度,截至目前总数据量已经超过100PB,日增数据量超过200TB。......
  • 网易云音乐是音乐爱好者的集聚地,云音乐推荐系统致力于通过AI算法的落地,实现用户千人千面的个性化推荐,为用户带来不一样的听歌体验。......
  • 随着互联网业务的发展,产生了大量的数据,数据经过分析会推动业务的发展。将数据中蕴含的知识用图的结构表示出来,就形成了知识图谱。......
  • 本文详细分析了在信息流推荐中,传统NLP做内容理解时的局限性,以及新的要求。我们通过对实际用户行为的分析,总结了一套基于兴趣点图谱的内容理解方案......
  • 如今大数据在各行业的应用越来越广泛:运营基于数据关注运营效果,产品基于数据分析关注转化率情况,开发基于数据衡量系统优化效果等......
  • 知识图谱的构建包括逻辑建模、隐含空间分析、人机交互和本体模型支撑等多种方法。我们将分析各种构建方法的问题和挑战,指出自动构建的要素和应用场景。......
  • Kafka是由Linkedin公司开发的,它是一个分布式的,支持多分区、多副本,基于Zookeeper的分布式消息流平台,它同时也是一款开源的基于发布订阅模式的消息引擎系统。......
  • 在互联网的早期,各个垂直领域都是缺少竞品的空白区域,平台属于野蛮生长时期,最需要做好获客,适合AARRR模型。而在当下各个细分领域的供需双边都饱和的情况下,获客成本越来越高,且留存的成......
  • 知识图谱是一个比较新的工具,它的主要作用还是在于分析关系,尤其是深度的关系。所以在业务上,首先要确保它的必要性,其实很多问题可以用非知识图谱的方式来解决。......
  • 这篇主要由五个部分来组成:首先是有赞的实时平台架构。其次是在调研阶段我们为什么选择了Flink。在这个部分,主要是Flink与Spark的structuredstreaming的一些对比和选择Flink的原因。......
  • 正常情况下,一般都是源数据到Kafka,再有消费者处理数据,将数据写入HBase。但是,如果逆向处理,如何将HBase的数据迁移到Kafka呢?......
  • 在互联网的排序业务中,比如搜索、推荐、广告等,AUC(AreaundertheCurveofROC)是一个非常常见的评估指标。......
  • 在分布式系统中,我们广泛运用消息中间件进行系统间的数据交换,便于异步解耦。现在开源的消息中间件有很多,前段时间产品RocketMQ(MetaQ的内核)也顺利开源,得到大家的关注。......
  • 哪些维度进行汇总等,需要根据业务需求及明细层实际汇总频率来确定,原则上,业务使用频繁的的维度需要对这些维度建立汇总层,汇总的指标可以和业务需求共同设计完成。......
  • 知识图谱一直是研究的热点,东南大学漆桂林老师等发表了一篇关于中文知识图谱构建的综述论文,详细讲述了当前中文知识图谱的研究进展,是非常好的学习资料......
相关主题
大家在关注
我们的推荐
最新的干货