快讯

掌握技术趋势,了解最新行业动向

周五

2020-09-25

  • 如何让数据安全地发挥其真正价值?

    你是否经历过这样的场景:和朋友在聊天软件上说着夏天到了,该减肥了。再去打开购物软件的时候,发现首页上多了许多瑜伽垫、弹力带等运动用品的推荐;或许你对这样的“现代科技”惊叹过,抑或许你对这样的“实时监控”惊慌过,但由于这样的事情已经屡见不鲜了,所以你从未因此申诉过自己的数据被“窃取”了。 各类囊括了我们衣食住行需求的App让我们的生活更加便捷,电子商务、新零售、物流业也被注入了蓬勃发展的动力。 与此同时App的数据安全问题也日益暴露出来,前有第三方iOS程序私自监控剪贴板,后有315晚会上央...

  • 严选埋点质量保障体系建设

    随着业务的高速发展,对于精细化流量运营的需求不断提升,埋点量级也在不断提升,埋点数据的质量问题是绕不过去的一个点。我们主要围绕“埋点管理”(定义管理和流程控制)、“埋点线下保障”、“埋点线上保障”这三个环节展开。改造流程、优化策略,打造相应的工具平台来固化流程和辅助测试,保障埋点开发正确性的同时,也提高协作效率。 随着业务的高速发展,对于精细化流量运营的需求不断提升,埋点量级也在不断提升,埋点数据的质量问题是绕不过去的一个点,但埋点质量保障又是个老大难问题: 首先,由于埋点是非结构化的数...

  • 企业究竟该如何构建数据模型?

    模型没有对错之分,只有适合的业务场景之分。数据模型能够促进业务与技术进行有效沟通。只要基于数据进行决策及拓展业务边界,好的数据模型必不可少。那么,企业究竟该如何构建数据模型呢? 数据中台能解决什么问题? 我们用四个字总结:全、统、通、用。全:数据中台和数据仓库的区别,数据仓库是满足业务需求或业务主题的;而数据中台是一个大而全的概念,为企业提供战略性的数据中台服务。数据应收尽收,所有能沉淀到数据中台的数据都收集到数据中台,包括增量、全量、实时、离线的数据。 统:统一数据标准规范。从数据质量标准、安...

  • 数据科学家应该了解的最佳软件工程实践

    本文最初发表在 Towards Data Science 博客,经原作者 Kurtis Pykes 授权,InfoQ 中文站翻译并分享。 我一直与朋友们热切地研究并尝试一些能使我成为更好的数据科学家的方法。如果不与那些帮助过我的人们分享目前的情况,我是不可能在事业上取得进步的。 最近,我在 LinkedIn 上进行了一次民意调查,我惊讶地发现,很多人持有这样的观点:数据科学家必须懂得编程标准并遵循工程最佳实践。 投票结果 许多数据科学家(包括我自己)都缺乏基本的统计学知识,对统计学的应...

  • Android端代码染色原理及技术实践

    导读 高德地图开放平台产品不断迭代,代码逻辑越来越复杂,现有的测试流程不能保证完全覆盖所有业务代码,测试不到的代码及分支,会存在一定的风险。为了保证测试全面覆盖,需要引入代码覆盖率做为测试指标,需要对SDK代码进行染色,测试结束后可生成代码覆盖率报告,作为发版前的一项重要卡点指标。本文小结了Android端代码染色原理及技术实践。 相关阅读:iOS代码染色原理及技术实践 JaCoCo工具 JaCoCo有以下优点: 支持Ant和Gradle打包方式,可以自由切换。 支持离线模式,更贴合SDK的使用...

  • Let’s Encrypt实践指北

    最近刚好有个项目需要配置HTTPS,也购买了域名,尤其在知道了本文要介绍的“神器” —— Let’s Encrypt 之后,大大简化了学习成本和时间。 初衷 一直以来,对于HTTPS证书的概念都有些含糊不清,似懂非懂。原因是自己之前比较懒,对于一些需要前置条件(买域名买证书等)才能玩的东西总是积极不起来(对!一定是穷)。而最近刚好有个项目需要配置HTTPS,也购买了域名(实践时自己还是买了域名),尤其在知道了本文要介绍的“神器” —— Let’s Encrypt 之后,大大简化了学习成本和...

  • 腾讯信息流热点挖掘技术实践

    导读: 当前各大资讯社交类APP都在显著的版面展示或者推荐热点相关内容,信息流应用能否快速发现热点、引导用户阅读热点,是影响用户体验的重要因素。本次分享主要介绍腾讯在热点挖掘方面的工作。基于搜索数据和自媒体文章,通过时序分析方法和内容聚类相结合的方法挖掘热点,并将热点聚类成事件和话题。用户搜索和媒体生产能够从消费和生产两个方面更加准确的度量热度,事件和话题同时能够辅助用户理解,做到热点的个性化下发,从而提升信息流热点体验。本文主要内容包括: 项目背景 相关研究方法 热点计算框架 热点挖掘 热点应...

  • Netflix推荐系统如何推动业务增长?

    本文最初发布于towardsdatascience.com网站,经原作者授权由InfoQ中文站翻译并分享。 Netflix正在将古老的电视行业带入互联网时代。Netflix允许用户随时通过各种互联网连接的设备流式传输庞大的电影和电视节目片库中的数据。公司的主要收入来自用户的订阅费用。那么,Netflix的推荐系统在其日益壮大的过程中扮演了什么样的角色呢? Netflix是一家总部位于美国的媒体服务提供商。它使用订阅模式来提供影片流媒体服务。它提供的内容包括电视节目、内部制作的内容以及电影等...

  • TiDB 4.0 在 VIPKID 的应用实践

    本文分享的是 TiDB 4.0 版本在 VIPKID 的应用实践,包括 TiDB 在 VIPKID 的应用场景以及 TiDB 4.0 带来的惊喜和收益。 TiDB 在 VIPKID 的应用场景 首先简单介绍一下 VIPKID,VIPKID 是一家在线少儿英语教育公司,专注于服务 4-15 岁的青少儿和他们家长们,主要提供北美外教一对一授课服务,目前已经有超过 70 万的付费用户。 场景一:大数据量及高并发写入 回归主题, TiDB 在 VIPKID 的第一个应用场景是一些大数据量和高并发写...

  • 为什么卷积神经网络优于传统机器学习算法?

    本文最初发表于 Towards Data Science 博客,经原作者 Rade Nje?i? 授权,InfoQ 中文站翻译并分享。 近十年来,随着深度学习的发现,图像分类领域经历了复兴。传统的机器学习方法已被更新的、更强大的深度学习算法所取代,例如卷积神经网络。然而,要真正理解并欣赏深度学习,我们必须知道为什么其他方法失败了,而深度学习却成功了。在本文中,我将试图通过对 Fashion MNIST 数据集应用不同的分类算法来回答其中一些问题。 数据集信息 Fashion MNIST 是...

  • 同步与异步Python有何不同?

    你是否听到人们说过,异步Python代码比“普通(或同步)Python代码更快?果真是那样吗? “同步”和“异步”是什么意思? Web应用程序通常要处理许多请求,这些请求在很短的时间段内来自不同的客户端。为避免处理延迟,必须考虑并行处理多个请求,这通常称为“并发”。 在本文中,我将继续使用Web应用程序作为例子,但是要记住还有其它类型的应用程序也从并发完成多个任务中获益,因此这个讨论并不仅仅是针对Web应用程序的。 术语“同步”和“异步”指的是编写并发应用程序的两种方式。所谓的“同步”服务器使用...

  • 实战贴:如何使用机器学习检测欺诈?

    本文最初发表于 Towards Data Science 博客,经原作者 Kurtis Pykes 授权,InfoQ 中文站翻译并分享。 机器学习是人工智能的一个子集,它赋予了系统从经验中自动学习和改进的能力,无需进行显式编程。如此说来,我们(人类)已经可以向计算机提供大量的数据集,让计算机学习模式,这样它在面对一个或多个新实例时,能够学习如何作出决定——当我发现这一见解时,我立即知道世界即将发生改变。 报告显示,欺诈行为给全球经济造成了 3.89 万亿英镑的损失,在过去十年里损失上升了 56...

  • Flutter 完成全平台制霸:实现 Windows 应用支持

    Flutter 作为跨平台开发利器,一经推出便在业内赢得了不错的口碑。Flutter 最初是应用于 iOS 和 Android 应用开发的,后扩展到了 Web、macOS 和 Linux,现如今也可以开发 Windows 应用了,补齐了全平台的最后一块拼图。 Flutter 作为谷歌出品的 UI 框架,凭借“多端一致”和“渲染性能”两方面的优势,深受广大开发者的推崇。谷歌曾表示 Flutter 的目标是提供一个可移植的框架,从而在各种平台上都能构建以原生速度运行的 UI。这也意味着,在谷歌...

周四

2020-09-24

  • TensorFlow推出新接口,简化 ML移动端开发流程

    概述 在移动设备上使用 TensorFlow Lite 模型运行推理不仅仅是与模型交互,还需要额外的代码来处理复杂的逻辑,如数据转换、预处理/后处理、加载关联文件等。 额外的代码 https://tensorflow.google.cn/lite/guide/lite_support 今天,我们将为大家介绍?TensorFlow Lite Task Library,这是一组功能强大且易于使用的模型接口,可代您处理大多数预处理和后处理以及其他复杂逻辑。Task Library 支持主流的机...

  • 从数据到大数据,数据技术&工具的演变

    编辑导语:大数据近些年来是一个十分火热的话题,关于大数据的文章也是数不胜数。本文作者通过梳理自己看过的大数据相关的资料和书籍,为我们介绍了从“小数据”演化为“大数据”的过程是怎样的?并且分享了一些数据技术以及工具。 对于大数据,叮当一直都很感兴趣,最近正好在看数据相关的书和资料,就把这些东西梳理了一下。本文将用4张逻辑图为主线,简单介绍一个产品从“小数据”演化为“大数据”的过程,及可能用到的工具。 本文核心逻辑: 一、一个简陋版互联技术架构 假设我们要搭建一个小网站,在不使用成熟SaaS...

  • 这个MySQL优化原理剖析,比照X光还清楚

    作者?????沈启超,19年硕士毕业于东南大学,目前在腾讯CSIG企业产品部担任后台开发,同时也参与公司内部存储开源组件MySync的开发。 前言:MySQL架构体系 首先分享实验前的基础知识,?MySQL主要分为Server层与存储引擎层。 Server层主要?包含连接器、检索内存、分析器、优化器、执行器等,所有跨存储引擎的功能均于这一层构建,例如存储过程、触发器、视图,函数等,有一个标准化的binglog日志模块。 存储引擎负责数据的存储与存取,使用可更换的插件式架构,拥有InnoDB、My...

  • 黄奇帆:新基建正全面重塑生产关系,为释放数字生产力奠定基础

    在9月23日举行的“新基建新经济高峰论坛”上,中国国际经济交流中心副理事长 黄奇帆发表了以《新基建、新经济、新文明》为主题的演讲,作为受邀出席本次峰会报道的技术媒体,InfoQ特别整理刊发了发布于活动举办方平台上的这一篇文章,供IT技术及其相关产业圈读者阅读传播。 *以下为黄奇帆演讲全文 2020年一定是人类历史上值得铭记的一年。 工业时代历经百年形成的全球经济体系、治理体系,因为新冠疫情造成了困难而加速了变革,并把2020年变成了人类从工业文明到数字文明演化的一个重要分水岭。 历史上文明的更迭...

  • RDMA在数据中心的可靠传输

    背景 高带宽、低延迟是目前数据中心应用的基本需求。NVM(Non-Volatile Memory)和 RDMA(Remote Direct Memory Access)可以称得上加速数据中心应用的两架马车,分别从存储和网络方面满足高带宽、低延迟的需求。 TCP/IP 只适用于中等带宽需求且延迟不敏感的应用,不同层级间的数据拷贝和协议栈本身复杂性(现代网卡已经支持部分功能卸载,例如 TSO、CSO、LRO 等,但并不彻底)为 TCP/IP 应用引入了大量延迟。RDMA 通过 Memory Regi...

  • 2021年十大数字化转型趋势

    导语 9月21日,福布斯网站发文分析2021年十大数字化转型趋势。 一、5G 远程办公在2020年成为常态,对可靠连接和更多带宽的需求以及对手机、平板电脑等的依赖更甚,从而凸显了5G需求。如今,5G部署已成为解决方案的重要组成部分,其价值将在2021年得到充分体现。 二、客户数据平台 IBM估计,“坏数据”每年会造成约3万亿美元的损失,应对这一挑战已成为首要任务。客户数据平台(CDP)通过从所有可用的数据源收集数据、对其进行组织、标记,然后供需要访问的人使用,来帮助解决这个问题。CDP将在2...

  • 从初级工程师发展到高级工程师,需要跨越的鸿沟

    摘要:程序员是吃青春饭的吗?等我们老了,技术过时了,公司有什么理由不裁掉我们,去雇一些既有活力、薪资要求又低的年轻人呢?这个老生常谈的问题困扰着诸多渐入中年的程序员。本文告诉你如何增强自己的核心竞争力,在知识飞速更新的行业中站稳脚跟,跨过“初级工程师”和“高级工程师”之间的鸿沟。 我曾在CS职业论坛**/r/cscareerquestions上回答了一个问题,该回答描述了我在程序员职业道路早期必须**要涉足的几个领域,并就此引申出我为什么认为高级程序员不必担心自己的技术会过时。 我认为社区中有很...

扫码关注云+社区

领取腾讯云代金券

http://www.vxiaotou.com