搜索 | 会员  
  • 现在机器学习应用非常流行,了解机器学习项目的流程,能帮助我们更好的使用机器学习工具来处理实际问题。......
  • 为了应对随着数据量的增长、数据处理性能的可扩展性,许多企业纷纷转向Hadoop平台来搭建数据分析平台。Hadoop平台具有分布式存储及并行计算的特性,因此可轻松扩展存储结点和计算结点,解决数据......
  • 过去十年中人工智能的飞速增长刺激了当今就业市场对AI和ML技能的巨大需求。从金融到医疗保健,现在几乎所有行业都在使用基于ML的技术。本文将介绍一系列可用于构建机器学习模型的最佳框架和库。......
  • 深度学习在近几年里取得了巨大的进步,它已经或者是有望成功地被应用在我们许多生活场景中,比如自动驾驶、安防、翻译、医疗等等。可以说,计算机的计算和通信能力的大幅提升是促使深度学习成功......
  • 推荐系统是一种信息过滤系统,用于预测用户对物品的“评分”或“偏好”。个性化推荐已经在电商(Amazon,淘宝,京东等)、电影和视频(Youtube,Hulu,爱奇艺,腾讯视频)、个性化音乐(Spotify......
  • 平台出于内容生态和社会责任的考量,像低俗内容的打压,标题党、低质内容的打压,重要新闻的置顶、加权、强插,低级别账号内容降权都是算法本身无法完成,需要进一步对内容进行干预。......
  • 大数据平台架构设计沿袭了分层设计的思想,将平台所需提供的服务按照功能划分成不同的模块层次,每一模块层次只与上层或下层的模块层次进行交互(通过层次边界的接口),避免跨层的交互,这种设计......
  • 本文主要是通过作者在搭建使用计算平台的过程中,写出对于Spark的理解,并且介绍了Spark在当前的DataMagic是如何使用的,当前平台已经用于架平离线分析,每天计算分析的数据量已经达到千亿~万亿......
  • 想成为数据科学家?你得是个博闻强识,又对新鲜事物保持好奇心的人。正因为如此,数据科学家会掌握几乎所有的常见算法,并精通其中一门,这样可以快速适应新领域的问题。......
  • 对于算法分发很多人会有所误解,这或许源自远观而缺乏了解,才会觉得算法猛如虎。而当你走近了算法分发,有了一定的了解之后,可能会有重新的认知:算法如虎,细嗅蔷薇。......
  • 在线广告是互联网行业常见的商业变现方式。从工程角度看,广告索引的结构和实现方式直接决定了整个系统的服务性能。本文以美团点评的搜索广告系统为蓝本,与读者一起探讨广告系统的工程奥秘。......
  • Hive窗口函数可以计算一定范围内、一定值域内、或者一段时间内的累积和以及移动平均值等;可以结合聚集函数SUM()、AVG()等使用;可以结合FIRST_VALUE()和LAST_VALUE(),返回窗口的第一个和最后......
  • 主流的三种kafka监控程序分别为:KafkaWebConsloleKafkaManagerKafkaOffsetMonitor......
  • KafkaWebConsole是kafka的开源web监控程序.功能介绍如下:brokers列表连接kafka的zk集群列表所有topic列表,操作相应topic可以浏览查看相应message生产和消费流量图.......
  • 微博,一个DAU上亿、每日发博量几千万的社交性产品,拥有庞大的数据集。如何高效得从如此规模的数据集中挖掘出有价值的信息,以增强用户粘性,提高信息传播速度,就成了重中之重。因此,我们引......
相关主题
大家在关注
我们的推荐
最新的干货