2 天前 / hyper0x
机器之心报道编辑:陈萍、小舟 《我的世界》里,玩家不一定都是人类,现在 AI 也会玩了。《我的世界》是全球知名度最高的开放世界游戏。小朋友只需观看十分钟的教学视频,就能学会在游戏中寻找稀有的钻石,但这却是 AI 此前无法企及的高度。 今天 OpenAI 的研究团队宣布他们开发了一种能玩《我的世界》的智能体,其中使用《我的世界》游戏大量未标记视频数据集训练神经网络,仅使用少量标记数据。 微调之后,OpenAI 训练的模型还可以学习制作挖矿工具,熟练的人类玩家在 20 分钟内可以完成这个任务(24000 次操作)。
8 天前 / zlt2000
点击上方“陶陶技术笔记”关注我 回复“资料”获取作者整理的大量学习资料! 一、说明 本文分享基于 Fate 自带的测试样例,进行 纵向逻辑回归 算法的模型训练,并且通过 FATE Board 可视化查看结果。 本文的内容为基于《隐私计算 FATE- 概念与单机部署指南》中部署的环境。 二、进入容器 执行以下命令,进入 Fate 的容器中: dockerexec-it$(dockerps-aqf"name=standalone_fate")bash 可以看到其中有一个 examples 的目录,里面包含各种算法的测试样例,以及测试的数据。
10 天前 / 美团技术团队
总第 516 篇 2022 年 第 033 篇 推荐系统是效果导向的数据应用服务,在功能的“有”和“无”之间,有很长的效果“好”和“坏”的光谱。本文以用户请求的粒度建立质量模型,通过数据血缘关联了数据表、算法模型、系统服务和用户请求,并结合美团综合业务的实践进行了拓展泛化,希望能对大家有所帮助或启发。1 前言 2 现状分析 3 建设思路 3.1 业务语境下的质量 3.2 缺陷的考量和选择 3.3 度量和计算的选型 4 计算方式 4.1 计算公式 4.2 业务泛化 4.3 指标体系 4.4 血缘拓展 5 指标运营 5.1 系统实现 5.2 告警跟进 5.3 治理效果 5.4 资产沉淀 6 未来规划 1 ...
15 天前 / 博文视点Broadview
点击“博文视点 Broadview”,获取更多书讯 近两年,人工智能领域的大模型可谓炙手可热。以自然语言处理领域为例,自 BERT 横空出世,在各种评测上分数一飞冲天,在斯坦福阅读理解评测集上超越人类水平之后,各种越来越大的自然语言处理模型不断涌现,并在各种评测中不断刷新出新的记录。 图 1 是近年来不同的预处理模型的情况,可以看出模型规模呈指数级增长。由此,许多人已经对模型越大效果越好(Larger model, better performance)深信不疑,并逐渐形成了 AI 领域的“军备竞赛”。
34 天前 / hyper0x
选自 arXiv 作者:Chitwan Saharia 等 机器之心编译 机器之心编辑部 OpenAI:DALLE 2 就是最好的。谷歌:看下我们 Imagen 生成的柴犬? 多模态学习近来受到重视,特别是文本 - 图像合成和图像 - 文本对比学习两个方向。一些模型因在创意图像生成、编辑方面的应用引起了公众的广泛关注,例如 OpenAI 的文本转图像模型 DALLE、英伟达的 GauGAN。现在,来自谷歌的研究者也在这一方向做出了探索,提出了一种文本到图像的扩散模型 Imagen。
36 天前 / 微信搜「腾讯云原生」
朱建平,TEG/ 云架构平台部 / 块与表格存储中心副总监。08 年加入腾讯后,承担过对象存储、键值存储,先后负责过 KV 存储 -TSSD、对象存储 -TFS 等多个存储平台。 NoSQL 技术和行业背景 NoSQL 是对不同于传统关系型数据库的一个统称,提出 NoSQL 的初衷是针对某些场景简化关系型数据库的设计,更容易水平扩展存储和计算,更侧重于实现高并发、高可用和高伸缩性。 NoSQL vs 关系型数据库其实早几年大家看两者的区别是清晰的,关系型数据库就是用 SQL 语句操作,具有行列结构和预定义 scheme 的二维表;NoSQL 是 Key-Value 存储...
45 天前 / hyper0x
机器之心报道机器之心编辑部 在写文章、画图之后,AI 大模型现在又同时有了打游戏的能力。不禁在想,DeepMind 的智能体 Gato 未来还能玩出哪些花活? 假如使用单一序列模型就能解决所有任务,是再好不过的事情,因为这种模型减少了不必要的麻烦。不过这需要增加训练数据的数量和多样性,此外,这种通用模型随着数据的扩充和模型的扩展,性能还会提高。从历史上看,更擅长利用计算的通用模型最终也会超过特定于专门领域的模型。
48 天前 / sjf0115
1. 类加载器我们知道,虚拟机在加载类的过程中需要使用类加载器进行加载,而在 Java 中,类加载器有很多,那么当 JVM 想要加载一个 .class 文件的时候,到底应该由哪个类加载器加载呢?这时候就需要双亲委派机制来告诉 JVM 使用哪个类加载器加载。在讲解什么是双亲委派机制之前,我们先看一下有哪些加载器。 从 Java 虚拟机的角度来讲,只存在两种不同的类加载器:一种是启动类加载器 Bootstrap ClassLoader,这个类加载器使用 C++ 语言实现,是虚拟机自身的一部分;另一种就是所有其他的类加载器,这些类加载器都由 Java 语言实现,独立于虚拟机外部...
57 天前 / hyper0x
机器之心报道 编辑:泽南、小舟 NLP 正在推动人工智能进入激动人心的新时代。 当前人工智能领域热度最高的方向就是预训练大模型了,很多人相信,这项研究已在通用人工智能领域初显成效。 自然语言处理领域著名学者,斯坦福大学教授克里斯托弗 · 曼宁(Christopher Manning)近期在美国人文与科学学院(AAAS)期刊的 AI & Society 特刊上发表了题为《Human Language Understanding & Reasoning》的文章,探讨了语义、语言理解的本质,展望了大模型的未来。
61 天前 / 我爱计算机视觉
关注公众号,发现 CV 技术之美 本文分享 ACL 2021 论文『VLM: Task-agnostic Video-Language Model Pre-training for Video Understanding』,由 Meta AI & CMU 联合提出任务无关视频语言模型视频理解预训练 VLM,代码已开源! 详细信息如下: 论文链接:https://arxiv.org/abs/2105.09996 项目链接:https://github.com/pytorch/fairseq/tree/main/examples/MMPT 01 摘要 我们提出了一种简单的、任务无关的多模态预训练方法,可以接受视频或文本输入,或同时接受视频或文本输入,用于各种最终的下游任务。
62 天前 / yybbb
一 导读 随着 BERT、Megatron、GPT-3 等预训练模型在 NLP 领域取得瞩目的成果,越来越多团队投身到超大规模训练中,这使得训练模型的规模从亿级别发展到了千亿甚至万亿的规模。然而,这类超大规模的模型运用于实际场景中仍然有一些挑战。首先,模型参数量过大使得训练和推理速度过慢且部署成本极高;其次在很多实际场景中数据量不足的问题仍然制约着大模型在小样本场景中的应用,提高预训练模型在小样本场景的泛化性依然存在挑战。为了应对以上问题,PAI 团队推出了 EasyNLP 中文 NLP 算法框架,助力大模型快速且高效的落地。
62 天前 / 我爱计算机视觉
关注公众号,发现 CV 技术之美 本文转自机器之心,编辑:杜伟、陈萍。 扩散模型正在不断的「攻城略地」。 扩散模型并不是一个崭新的概念,早在 2015 年就已经被提出。其核心应用领域包括音频建模、语音合成、时间序列预测、降噪等。 那么它在视频领域表现如何?先前关于视频生成的工作通常采用诸如 GAN、VAE、基于流的模型。 在视频生成领域,研究的一个重要里程碑是生成时间相干的高保真视频。来自谷歌的研究者通过提出一个视频生成扩散模型来实现这一里程碑,显示出非常有希望的初步结果。
62 天前 / 逗逗
省时查报告 - 专业、及时、全面的行研报告库 省时查方案 - 专业、及时、全面的营销策划方案库 【免费下载】2022 年 3 月份热门报告盘点某短视频 APP 推荐算法及策略最详细拆解大萧条来临前的几大征兆 机器学习在 B 站推荐系统中的应用实践小红书推荐系统中台应用实践微信视频号实时推荐技术架构分享推荐系统的变与不变:冷启动、召回排序等对比学习在快手推荐系统中的应用实践知识图谱在美团推荐场景中的应用实践淘宝首页猜你喜欢信息流推荐长序列实践今天给大家带来快手社区科学部资深推荐算法工程师牛亚男所做的分享《快手推荐系统精排模型实践。
65 天前 / kafeidou
Kubernetes 是为运行分布式集群而建立的,分布式系统的本质使得网络成为 Kubernetes 的核心和必要组成部分,了解 Kubernetes 网络模型可以使你能够正确运行、监控和排查应用程序故障。 网络是非常复杂的,拥有许多概念,对于不熟悉这个领域的用户来说,这可能会有一定的难度,这里面有很多概念需要理解,并且还需要把这些概念整合起来形成一个连贯的整体,比如网络命名空间、虚拟接口、IP 转发、NAT 等概念。
68 天前 / reesunhuang
“本文主要介绍 skynet 的设计理念和特点,对于具体实现细节暂不展开。 ”skynet 是什么?“skynet 是一个为网络游戏服务器设计的轻量框架。但它本身并没有任何为网络游戏业务而特别设计的部分,所以尽可以把它用于其它领域。" ”skynet 设计初衷“作为服务器,通常需要同时处理多份类似的业务。例如在网络游戏中,你需要同时向数千个用户提供服务;同时运作上百个副本,计算副本中的战斗、让 NPC 通过 AI 工作起来,等等。在单核年代,我们通常在 CPU 上轮流处理这些业务,给用户造成并行的假象。