搜索 | 会员  
  • 推荐系统是一种信息过滤系统,用于预测用户对物品的“评分”或“偏好”。个性化推荐已经在电商(Amazon,淘宝,京东等)、电影和视频(Youtube,Hulu,爱奇艺,腾讯视频)、个性化音乐(Spotify......
  • 平台出于内容生态和社会责任的考量,像低俗内容的打压,标题党、低质内容的打压,重要新闻的置顶、加权、强插,低级别账号内容降权都是算法本身无法完成,需要进一步对内容进行干预。......
  • 大数据平台架构设计沿袭了分层设计的思想,将平台所需提供的服务按照功能划分成不同的模块层次,每一模块层次只与上层或下层的模块层次进行交互(通过层次边界的接口),避免跨层的交互,这种设计......
  • 本文主要是通过作者在搭建使用计算平台的过程中,写出对于Spark的理解,并且介绍了Spark在当前的DataMagic是如何使用的,当前平台已经用于架平离线分析,每天计算分析的数据量已经达到千亿~万亿......
  • 想成为数据科学家?你得是个博闻强识,又对新鲜事物保持好奇心的人。正因为如此,数据科学家会掌握几乎所有的常见算法,并精通其中一门,这样可以快速适应新领域的问题。......
  • 对于算法分发很多人会有所误解,这或许源自远观而缺乏了解,才会觉得算法猛如虎。而当你走近了算法分发,有了一定的了解之后,可能会有重新的认知:算法如虎,细嗅蔷薇。......
  • 在线广告是互联网行业常见的商业变现方式。从工程角度看,广告索引的结构和实现方式直接决定了整个系统的服务性能。本文以美团点评的搜索广告系统为蓝本,与读者一起探讨广告系统的工程奥秘。......
  • Hive窗口函数可以计算一定范围内、一定值域内、或者一段时间内的累积和以及移动平均值等;可以结合聚集函数SUM()、AVG()等使用;可以结合FIRST_VALUE()和LAST_VALUE(),返回窗口的第一个和最后......
  • 主流的三种kafka监控程序分别为:KafkaWebConsloleKafkaManagerKafkaOffsetMonitor......
  • KafkaWebConsole是kafka的开源web监控程序.功能介绍如下:brokers列表连接kafka的zk集群列表所有topic列表,操作相应topic可以浏览查看相应message生产和消费流量图.......
  • 微博,一个DAU上亿、每日发博量几千万的社交性产品,拥有庞大的数据集。如何高效得从如此规模的数据集中挖掘出有价值的信息,以增强用户粘性,提高信息传播速度,就成了重中之重。因此,我们引......
  • 从物理结构上讲,HBase由三种类型的服务器构成主从式架构。RegionServers为数据的读取和写入提供服务。当访问数据时,客户端直接和RegionServers通信。Region的分配,DDL(create,deleteta......
  • Canvas是用于设计和记录机器学习系统的模板。它比简单的文本文档具有优势,因为Canvas用简单的部件通过部件之间的相关性来寻找机器学习系统的关键组件。这个工具已经很流行,因为它对复杂项目进......
  • 对于大数据软件而言,成功的关键是为企业提供基础应用程序和工具来构建自定义应用程序。以下是20家专门从事大数据构建或相关业务的企业所提供的应用程序。......
  • 本文依次从spark生态,原理,基本概念,sparkstreaming原理及实践,还有spark调优以及环境搭建等方面进行介绍,希望对大家有所帮助。......
相关主题
大家在关注
我们的推荐
最新的干货