• 图机器学习

  • 深入浅出Spring

  • 亿级电商实时数据分析平台构建实战

  • Python数据处理实战:基于真实场景的数据

  • 黄美灵的Spark ML机器学习实战

  • 目标检测模型YOLOV3原理及实战

  • 知识图谱实战

  • 敏捷Agile快速入门

GPT-3的威力,算法平台的阴谋

大概一个月之前,史上最巨无霸NLP模型GPT-3问世。当时它向世界展示的能力是,“不仅会写短文,而且写出来的作文挺逼真的,几乎可以骗过人类,可以说几乎通过了图灵测试。”可能是因为它的前一代模型GPT-2也因“擅长写作”成名,所以这个和GPT-2几乎完全同构的“哥哥”,并没有让媒体以及领域相关的算法工程师们特别惊讶。堆叠参数量并增加训练样本,可以让模型在同一个任务上表现的更好,这个结论已经深入人心。然而一周之前,一些网友用GPT-3模型开发了各种各样的应用,证明了GPT-3不仅能够答题、写文章,做翻译,还能生成代码、做数学推理、数据分析、画图表制作简历,甚至玩游戏都可以,而且效果...[详情]

医学AI又一突破,微软开源生物医学NLP基准:BLURB

BLURB 包括 13 个公开可用的数据集,涉及 6 个不同的任务。为了避免偏重多可用数据集的任务,如命名实体识别(NER),BLURB 的报告和排名,将所有任务的宏观平均数作为主要得分。BLURB 排行榜是不分模型的。任何能够 ...

YOLOv5被禁用!Kaggle全球小麦检测竞赛结果惹争议

昨天Kaggle 全球小麦检测(Global Wheat Detection)比赛落下帷幕,共计2,270 支队伍参赛。比赛结束后,讨论区本该是晒成绩或者解决方案的,但却出现了大量关于"YOLOv5"的讨论。因为YOLOv5的license 是GPL 协议 ...

关于Transformer,那些的你不知道的事

基于Transformer的架构主要用于建模语言理解任务,它避免了在神经网络中使用递归,而是完全依赖于self-attention机制来绘制输入和输出之间的全局依赖关系。

GPT-3的威力,算法平台的阴谋

大概一个月之前,史上最巨无霸NLP模型GPT-3问世。当时它向世界展示的能力是,“不仅会写短文,而且写出来的作文挺逼真的,几乎可以骗过人类,可以说几乎通过了图灵测试。”可能是因为它的前一代模型GPT-2也因“擅长 ...

Facebook将Windows版PyTorch的开发维护移交给微软

Facebook 通过 PyTorch 官方博客宣布,微软已扩大了对 PyTorch 社区的参与,现在拥有 PyTorch 在 Windows 上的开发和维护所有权。PyTorch 是基于 Torch 的开源 Python 机器学习库,由 Facebook 的人工智能研究团队开 ...

芯片业最大并购案!消息称英伟达拟收购Arm 估值超320亿美元

7月31日, 据两名知情人士透露,美国芯片公司英伟达正在洽谈以现金加股票的方式从软银手中收购其英国芯片设计子公司Arm,这笔交易对ARM的估值超过320亿美元。据悉,谈判始于近几个月,此前英伟达曾就潜在收购事宜与 ...

炒了这么久的人工智能帮助诊断新型冠状病毒肺炎,真的管用吗?

尽管机器学习有望作为一种强大的医学工具,但统计学家警告说,当前的模型存在严重的缺陷。多年来,许多人工智能发烧友和研究人员一直坚信机器学习将改变现代医学。他们已经开发了数千种算法来诊断癌症,心脏病和精神 ...

PyTorch 1.6、TensorFlow 2.3、Pandas 1.1 同日发布!都有哪些新特性?

7月29日,PyTorch 1.6、TenorFlow 2.3、Pandas 1.1恰巧同时发布。这三个库都是定期滚动更新,大约每个季度更新一次小版本。在AI内卷化达到“灰飞烟灭”的今日,仅仅会对PyTorch或TensorFlow进行调用已经不具有竞争力 ...

MIT研究人员发现 ImageNet 数据集存在系统性缺陷

“我们的分析明确指出,嘈杂的数据收集管道是如何导致结果基准与其作为代理的实际任务之间的系统性不一致的”, 麻省理工学院的研究人员 在一篇题为《从 ImageNet 到图像分类:基准测试的情景化进展》的论文中写道, ...

深入了解传感器的工业用途

当今的工业格局具有前所未有的波动性,不确定性,复杂性和模糊性。结果,对于资产和人员而言,以更低的成本和更高的安全性来提高运营效率变得越来越重要。在这种背景下,传感技术及其进步对工业运营保持竞争力和效率 ...

170多万篇论文,存储量达1.1 TB,Kaggle上线arXiv完整数据集

现在,用户可以在 Kaggle 平台上获取 arXiv 论文了!众所周知,arXiv 是我们搜索、浏览和下载学术论文的重要工具。近 30 年来,arXiv 为公众和研究社区提供了开放获取学术论文的服务。这些论文涉及物理学的庞大分支 ...

专为流式数据设计的另一种缓存:流式缓存技术解读

传统的缓存解决方案将每一个缓存项都当作一个不可变的数据块对待,这在重度追加的注入工作负载上会产生很多问题,而这种模式的负载在 Pravega 上却非常常见。每一个追加到流上的事件因此要么需要有它自己独立的缓存 ...

Spark SQL 物化视图技术原理与实践

物化视图主要用于预先计算并保存表连接或聚合等耗时较多的操作的结果,这样,在执行查询时,就可以避免进行这些耗时的操作,从而快速的得到结果。物化视图使用查询重写(query rewrite)机制,不需要修改原有的查询 ...

处理数据时也保证安全,IBM发布Linux版完全同态加密工具包

6 月初,IBM 发布了适用于 macOS 和 iOS 的完全同态加密(Fully Homomorphic Encryption,FHE)工具包,并表示 Linux 版本将在数周内推出。现在 Linux 版本发布了,其将 FHE 带到 IBM Z 和 x86 架构的多个 Linux 发 ...

RedMonk Q3语言排行:Rust首次进前20

知名软件行业分析公司 RedMonk 发布了 2020 年 6 月(Q3 季度)编程语言排行榜。RedMonk 编程语言排行榜通过追踪编程语言在 GitHub 和 Stack Overflow 上的代码使用情况与讨论数量,统计分析后进行排序,其旨在深入 ...

GCC并行编译大型源代码文件性能大幅提升

虽然 GNU Make 和其他构建系统可以很好地进行扩展以并发编译大量文件,不过 GCC 自身也一直在让 GCC 的更多工作在编译大型源代码文件时能够并行执行。早在2019年夏天,其团队就已开始尝试解决并行化遇到的瓶颈,让更 ...

深度传感器都有哪些创业机会?

以前,我们一直认为传统相机将3D世界转换为2D图像,已可以满足我们对于图像的应用,而2D图像中丢失的三维似乎并不重要。但随着计算机视觉(CV)的飞速发展以及与深度学习的结合,许多雄心勃勃的研究人员试图使机器通 ...

微服务架构的核心关键点

当我们架构微服务应用时首先遇到的一个问题是,作为消费者如何访问并调用服务提供者所提供的服务,作为服务提供者如何能让服务消费者知道并进行消费。在传统应用开发时,通常是在开发语言层面上解决这个问题,可能我 ...