7 天前 / 美团技术团队
总第 528 篇 2022 年 第 045 篇 粗排是工业界搜广推系统的重要模块。美团搜索排序团队在优化粗排效果的探索和实践中,基于业务实际场景,从精排联动和效果性能联合优化两方面优化粗排,提升了粗排的效果。本文介绍了美团搜索粗排的迭代路线、基于知识蒸馏和自动神经网络选择的粗排优化工作,希望为从事相关工作的同学带来一些启发或者帮助。1. 前言 2. 粗排演进路线 3. 粗排优化实践 3.1 精排联动效果优化 3.2 效果性能联合优化 4. 总结 5. 附录 1. 前言众所周知,在搜索、推荐、广告等大规模工业界应用领域,为了平衡性能和效果...
11 天前 / u128287
关于我:微信公众号:面试官问,原创高质量面试题,始于面试题,但不止于面试题。【萌新解题】系列文章试图从新人的角度去看待和解决力扣题目,本题是力扣第 2 题 两数相加:https://leetcode.cn/problems/add-two-numbers/。 题目描述给你两个非空 的链表,表示两个非负的整数。它们每位数字都是按照逆序的方式存储的,并且每个节点只能存储一位数字。 请你将两个数相加,并以相同形式返回一个表示和的链表。你可以假设除了数字 0 之外,这两个数都不会以 0开头。 前置知识点哨兵节点是为了简化处理链表边界条件而引入的附加链表节点。
14 天前 / 美团技术团队
总第 526 篇 2022 年 第 043 篇 Kafka 在美团数据平台承担着统一的数据缓存和分发的角色,随着数据量的增长,集群规模的扩大,Kafka 面临的挑战也愈发严峻。本文分享了美团 Kafka 面临的实际挑战,以及美团针对性的一些优化工作,希望能给从事相关开发工作的同学带来帮助或启发。1. 现状和挑战 1.1 现状 1.2 挑战 2. 读写延迟优化 2.1 概览 2.2 应用层 2.3 系统层 2.4 混合层 -SSD 新缓存架构 3. 大规模集群管理优化 3.1 隔离策略 3.2 全链路监控 3.3 服务生命周期管理 3.4 TOR 容灾 4 未来展望 1. 现状和挑战 1.1 现状 Kafka 是一个开源的流处理平台...
33 天前 / 逗逗
总第 445 篇 2021 年 第 015 篇 数据已成为很多公司的核心资产,而在数据开发的过程中会引入各种质量、效率、安全等方面的问题,而数据治理就是要不断消除引入的这些问题,保障数据准确、全面和完整,为业务创造价值,同时严格管理数据的权限,避免数据泄露带来的业务风险。数据治理是数字时代很多公司一项非常重要的核心能力,本文介绍了美团酒旅平台在数据治理方面的实践。一、背景 1. 为什么要做数据治理 2. 需要治理哪些问题 3. 美团酒旅数据现状 4. 治理目标 二、数据治理实践 1. 数据治理策略 2. 标准化和组织保障 3. 技术系统 4. 衡量指标 5. 治理效...
53 天前 / hyper0x
机器之心发布机器之心编辑部 YOLOv6 的精度与速度都远超 YOLOv5 和 YOLOX。 YOLOv6 是美团视觉智能部研发的一款目标检测框架,致力于工业应用。本框架同时专注于检测的精度和推理效率,在工业界常用的尺寸模型中:YOLOv6-nano 在 COCO 上精度可达 35.0% AP,在 T4 上推理速度可达 1242 FPS;YOLOv6-s 在 COCO 上精度可达 43.1% AP,在 T4 上推理速度可达 520 FPS。在部署方面,YOLOv6 支持 GPU(TensorRT)、CPU(OPENVINO)、ARM(MNN、TNN、NCNN)等不同平台的部署,极大地简化工程部署时的适配工作。
56 天前 / 美团技术团队
总第 519 篇 2022 年 第 036 篇 计算机视觉国际顶会 CVPR 2022 近日在美国新奥尔良召开,今年美团技术团队有多篇论文被 CVPR 2022 收录,这些论文涵盖了模型压缩、视频目标分割、3D 视觉定位、图像描述、模型安全、跨模态视频内容检索等研究领域。 本文将对 6 篇精选的论文做简要的介绍(附下载链接),希望能对从事相关研究的同学有所帮助或启发。 Paper 01 | Compressing Models with Few Samples: Mimicking then Replacing Paper 02 | Language-Bridged Spatial-Temporal Interaction for Referring Video Object Segmentation Paper 03 | 3D-SPS: Si...
56 天前 / sjf0115
▼ 关注「Apache Flink」,获取更多技术干货▼摘要:本文整理自美团实时数仓平台负责人姚冬阳在 Flink Forward Asia 2021 实时数仓专场的演讲。主要内容包括: 平台建设现状遇到的问题及解决未来规划 Tips:点击「阅读原文」查看原文视频 &PPT~ 01 平台建设现状 美团于 2018 年首次引入 Flink 实时计算引擎,当时的实时数仓概念还不太普及,平台只提供了 Flink Jar 任务的生命周期管理和监控报警。 2019 年,我们注意到实时计算的主要应用场景是解决离线数仓时效性低的问题。
62 天前 / 美团技术团队
总第 516 篇 2022 年 第 033 篇 推荐系统是效果导向的数据应用服务,在功能的“有”和“无”之间,有很长的效果“好”和“坏”的光谱。本文以用户请求的粒度建立质量模型,通过数据血缘关联了数据表、算法模型、系统服务和用户请求,并结合美团综合业务的实践进行了拓展泛化,希望能对大家有所帮助或启发。1 前言 2 现状分析 3 建设思路 3.1 业务语境下的质量 3.2 缺陷的考量和选择 3.3 度量和计算的选型 4 计算方式 4.1 计算公式 4.2 业务泛化 4.3 指标体系 4.4 血缘拓展 5 指标运营 5.1 系统实现 5.2 告警跟进 5.3 治理效果 5.4 资产沉淀 6 未来规划 1 ...
70 天前 / 美团技术团队
总第 515 篇 2022 年 第 032 篇 近日,美团搜索与 NLP 部 NLP 中心语义理解团队的小样本学习模型 FSL++ 在中文小样本语言理解权威评测基准 FewCLUE 榜单登顶,在自然语言推理(OCNLI)单任务中取得第一,并在极少数样本(一个类别仅 100 余个)的条件下,在新闻分类 (TNEWS)、科学文献学科分类(CSLDCP)任务上超过了人类识别精确度。1 概述 2 方法介绍 2.1 增强预训练 2.2 模型结构 2.3 数据增强 2.4 集成学习 & 自训练 3 实验结果 3.1 数据集介绍 3.2 实验对比 4 小样本学习策略在美团场景的应用 5 总结 1 概述 CLUE(Chinese Language Understanding Ev...
84 天前 / 美团技术团队
总第 512 篇 2022 年 第 029 篇 随着互联网产生的文本数据越来越多,文本信息过载问题日益严重,对各类文本进行一个“降维”处理显得非常必要,而文本摘要就是其中一个重要的手段。 本文首先介绍了经典的文本摘要方法,随后分析了对话摘要的模型,并分享了美团在真实对话摘要场景中面临的挑战。同时基于实际的场景,本文提出了阅读理解的距离监督 Span-Level 对话摘要方案(已发表在 SIGIR 2021),该方法比强基准方法在 ROUGE-L 指标和 BLEU 指标上提升了 3% 左右。
86 天前 / 开发者头条
本文内容节选自「码农周刊 VIP 会员专属邮件周报 Vol.092」,感谢阅读。 想邮件订阅周报?扫码即刻订阅!↓↓↓ 本期,首先分享的是 9 个好心态,摘录几条,共勉。 1)我接触的人可以不喜欢我。 2)慢一点,也没关系。 3)不可能人人都是船长,水手也有水手的精彩。 4)做一件事,就尽力做好。 5)并不是所有的努力都能看到即时的结果。 …… 重新理解张朝阳:初代大佬的价值归宿 https://mp.weixin.qq.com/s/lJetIcGtjItmG2zUDbaQbA 把目标瞄准在我们存在的意义,活一个说法。
94 天前 / Ryan众乐
从毕业到现在已经在北京 3 年了,当年一起来北京的同学,如今都有了要离开的打算。我也在萌生了想要去成都的想法。然而从投递简历开始,就感受到了今年确实不是很景气。很多大厂不是裁员就是锁 HC,面试邀约都显得非常宝贵。 字节(北京)一面 HTTPS 建立连接过程 http 缓存,强缓存时 cache-control 字符集是什么 publichttps://developer.mozilla.org/zh-CN/docs/Web/HTTP/Headers/Cache-Control 深拷贝的实现,如果遇到 function 怎么办 需要判断类型,对于基础类型,直接赋值,对于复杂类型则需要递归处理,并同时设置 map,避免嵌套。
125 天前 / 美团技术团队
总第 502 篇 2022 年 第 019 篇 针对视频数据,如何通过计算机视觉技术用相关数据,为用户和商家提供更好的服务,是一项重要的研发课题。本文将为大家分享短视频内容理解与生成技术在美团业务场景的落地实践。1. 背景 2. 短视频内容理解和生成技术实践 2.1 短视频内容理解 2.2 短视频内容生成 3. 总结展望 4. 作者简介 1. 背景 美团围绕丰富的本地生活服务电商场景,积累了丰富的视频数据。 上面展示了美团业务场景下的一个菜品评论示例。
125 天前 / 开发者头条
拒绝焦虑,不妨从这份 Newsletter 开始! 阿里技术副总裁贾扬清回应深夜逃离上海去美国:没有从阿里离职,中美往返也是正常差旅 4 月 14 日消息,阿里技术副总裁贾扬清在 facebook 上分享了自己在上海隔离以及乘国际航班回到美国的经历。据网传截图显示,贾扬清在 18 天的隔离之后,找到“Someone withconnection”获得了“a pass”,然后在凌晨四点,坐在一辆面包车的后座前往上海机场,最终搭上前往美国的航班。这篇文章引发热议,被外界传为贾扬清疫情深夜逃出上海,从浦东机场逃到了加州。
126 天前 / BloomingRose
大家好,我叫汤楚熙,来自美团数据平台中心的计算平台团队,当前主要工作内容是实时数仓平台的研发。今天和大家分享一下实时数据在美团的典型应用场景,实时数仓建设中的挑战和解决方案,包括一些关键的设计细节。主要介绍以下几方面内容: 建设背景 平台架构设计 平台建设实践 未来计划 一、建设背景 1、实时数据在美团的典型应用场景 美团作为本地生活领域的头部公司,在内部孵化了许多独立业务,可以看到有大家所熟悉的美团外卖、酒店、美团优选等,这些业务通过实时数据来支撑其内部各种各样的数据应用场景,比如 BI、算法、骑手调度等等。