搜索 | 会员  
  • 用户画像也是近几年比较热的一个词,不过很多小伙伴对于画像的认知还只是标签化的层面,或者只是利用其做一些简单的分群分析;如何全面地认知并做系统性地尝试,背后有非常多的点需要我们深思挖
  • 在开源盛世的今天,实时数仓的建设已经有了较为成熟的方案,技术选型上也都各有优劣。菜鸟作为物流供应链的主力军,时效要求已经成为了核心竞争力
  • Apache的Hadoop项目已几乎与大数据划上了等号。它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算。
  • 阿里强大的大数据建设方法论是怎样的?笔者从数据技术篇、数据模型篇以及数据管理篇三部分展开介绍,这些将让你开阔视野,同时也会带给你启发。
  • OPPO积累了大量的数据,上图右边是整体数据规模的演进:从2012年开始每年都是2~3倍的增长速度,截至目前总数据量已经超过100PB,日增数据量超过200TB。
  • 网易云音乐是音乐爱好者的集聚地,云音乐推荐系统致力于通过AI算法的落地,实现用户千人千面的个性化推荐,为用户带来不一样的听歌体验。
  • 如今大数据在各行业的应用越来越广泛:运营基于数据关注运营效果,产品基于数据分析关注转化率情况,开发基于数据衡量系统优化效果等
  • 在互联网的早期,各个垂直领域都是缺少竞品的空白区域,平台属于野蛮生长时期,最需要做好获客,适合AARRR模型。而在当下各个细分领域的供需双边都饱和的情况下,获客成本越来越高,且留存的成
  • 正常情况下,一般都是源数据到Kafka,再有消费者处理数据,将数据写入HBase。但是,如果逆向处理,如何将HBase的数据迁移到Kafka呢?
  • 哪些维度进行汇总等,需要根据业务需求及明细层实际汇总频率来确定,原则上,业务使用频繁的的维度需要对这些维度建立汇总层,汇总的指标可以和业务需求共同设计完成。
  • 从纸媒、电视传媒开始,内容产业搭载着互联网的发展快车,跨过了网络门户、论坛等形式,在移动互联网的普及下,终于迎来爆发式的发展。而随着内容产业的飞速发展,我们对内容的加工处理方式也逐
  • Hive的后端存储是HDFS,它对大文件的处理是非常高效的,如果合理配置文件系统的块大小,NameNode可以支持很大的数据量。但是在数据仓库中,越是上层的表其汇总程度就越高,数据量也就越小。而且
  • 在链接人与知识的路径中,知乎存在着大量的推荐场景。粗略统计,目前除了首页推荐之外,我们已存在着20多种推荐场景;并且在业务快速发展中,不断有新的推荐业务需求加入。
  • 在大数据系统中,我们往往无法直接对在线系统中的数据直接进行检索和计算。在线系统所使用关系型数据库、缓存数据库存储数据的方式都非常不同,很多存储系统并不适合分析型(OLAP)的查询,也不
  • 在移动互联网迅速发展的今天,信息量爆发性增长,人们获取信息的途径越来越多,如何从大量的信息中获取我们想要的内容,成为了推荐系统研究的重点。随着大数据产业的不断壮大,推荐系统在企业也
  • 地图
  • 本站
  • 我们
  • 服务
  • 版权
  • 联系
  • 回馈
  • 博客