回到顶部

【智能化可观测】可观测开源开发者 Meetup活动报名开启

Sat, 25 May 2024 14:00:00 GMT+08 ~ Sat, 25 May 2024 18:30:00 GMT+08

Hide

Tickets
    Please select the order price
    More Details

    Event DetailsHide...

    「可观测开源开发者 Meetup」由蚂蚁集团、咪咕互娱、蓝鲸智云、云杉网络联合举办,本次开源活动以智能化可观测:大模型驱动下的可观测演进为主题,将带来关于云原生可观测性技术的最新动态、实践案例和经验分享。

    智能可观测meet up主视觉.jpg

    用户报名通道现已开启,本次活动仅开放100个线下体验名额,即日起开始报名,至5月22日截止,快【点击报名】报名抢占席位吧!现场还有惊喜周边等你拿哦~


    以下是本次Meetup议程概览:


    主题一:数智赋能,运维转型——咪咕云游戏智能运维建设和实践
    主讲人:周鸣
    主讲人介绍:咪咕互娱运维总监,拥有超过10年以上的IT行业经验,精通各种主流的操作系统、数据库、网络设备和虚拟化技术。在云计算、大数据、人工智能等领域也有深入的研究和实践经验。
    主题介绍:
    咪咕互娱依托中国移动 5G 大带宽、低时延、广连接特点,以及 5G 网络切片、网络加速、QOS 保障等技术,紧扣云游戏云网融合、高画质、超低时延、跨终端等特点,充分发挥云网边端紧密协同,积极探索发展云游戏智能运维能力。 通过本次分享着重介绍咪咕云游戏在智能运维转型过程相关实践方案以及后续的规划路径。

    周鸣.jpg


    主题2: 《从小模型到大模型 - 蚂蚁可观测在 AIOps 领域的实践》
    主讲人:姚劲松
    主讲人介绍:蚂蚁集团智能可观测平台技术专家,2015年加入蚂蚁集团,长期从事可观测领域产品建设,主要建设蚂蚁第三代可观测产品 Antmonitor 和开源可观测产品 HoloInsight。
    主题介绍:

    Antmonitor 是蚂蚁集团发展多年的可观测产品,是蚂蚁集团研发、测试、SRE 等人员进行故障应急处理和日常问题分析的重要平台。蚂蚁可观测技术团队在时序数据和 AI 工程能力之上,构建了各种场景智能化的实践,为提升支付宝全局系统稳定性做出了重要贡献。此外,随着AI技术的爆火,我们发现 GenAI 在可观测场景下具有巨大的潜能。对内基于蚂蚁百灵大模型落地 Mpilot 产品,其通过时序助手、日志助手和告警助手来提供服务,旨在将智能助手嵌入到 Antmonitor 产品中,帮助开发同学更快的发现稳定性问题。

    HoloInsight 是近两年孵化的面向轻量化、多样化场景的监控产品,服务蚂蚁生态及开源社区,主要基于日志的实用观测能力、业务指标监控以及 AIOps 的前沿探索。当前已在支付宝小程序云、蚂蚁出海业务上线并提供服务。

    本次主要从小模型智能告警到大模型 Mpilot 产品介绍蚂蚁可观测在 AIOps 领域的实践分享,以及对外开源产品 HoloInsight 产品在该领域的实践案例。

    姚劲松.jpg

    主题3:《AI Infra 可观测场景时序数据写入性能优化实践
    主讲人: 春韶
    主讲人介绍:蚂蚁集团技术专家、CeresDB 核心开发者,Apache HoraeDB PPMC 成员,蚂蚁集团技术专家,有多年时序数据库开发经验。
    主题介绍:
    Large Language Models (LLM)现已成为业界热门话题,领先企业均投入资源开发自家的LLM。随着训练过程中 GPU 规模的迅猛扩张,不少项目已经动用逾万张GPU,这种前所未有的规模对训练效率和系统稳定性提出了史无前例的挑战。本次分享,我们将专注于 CeresDB 在 AI Infra 领域的应用,具体涉及到针对云原生环境下高基数可观测数据的写入性能优化措施。通过此次分享,您能深入了解 CeresDB 是如何应对大规模数据监控和存储问题。

    任春韶.jpg

    主题4:《腾讯游戏真·全栈观测实践 II》
    主讲人: 陈自欣
    主讲人介绍:蓝鲸监控运营负责人,SRE 经营联盟成员,前创业者, 在监控及可观测领域有近十年经验,主导蓝鲸监控与DeepFlow 的落地。
    主题介绍:
    腾讯蓝鲸智云,简称蓝鲸,是腾讯互动娱乐事业群 (lnteractive Entertainment Group, 简称 IEG) 技术运营部自主研发的一套用于构建企业研发运营一体化的 Paas 解决方案。其中蓝鲸观测平台是整体蓝鲸 Paas 平台的重要组成部分。

    在本次分享中,我们将介绍腾讯 IEG 蓝鲸观测平台如何运用前沿的 DeepFlow 的 eBPF 技术,结合传统的APM体系,实现了对游戏服务全链路、真全栈,无盲点观测,并着重分享线上实际业务案例。这一跨越系统、网络、应用、基础组件、服务到业务的监控能力,不仅提升了问题诊断的效率,还优化了应用性能,确保了游戏玩家能获得最佳的体验。

    陈自欣.jpg

    主题5:《LLM 驱动下的 eBPF Profiling 实践和探索》
    主讲人: 向阳
    主讲人介绍:清华大学博士,云杉网络研发 VP,DeepFlow 开源社区负责人。曾在国际顶级学术会议 ACM SIGCOMM、ACM IMC 上发表可观测性方向的学术论文,现负责可观测性产品 DeepFlow。
    主题介绍:

    eBPF 的零侵扰(Zero Code)和全栈(Full Stack)特性使得它成为了一种绝佳的 Continuous Profiling 实现技术。eBPF Profiling 数据涵盖应用函数、库函数、运行时函数、内核函数,能够提供全栈的性能优化信息,但全栈数据通常需要具有各种专业知识的人协同解读;针对此问题,DeepFlow 使用 LLM Agent 显著提升了 Profiling 数据的分析效率,从而快速给出专业直接的优化建议。

    另一方面,DeepFlow 的 eBPF Profiling 通过关联 CPU、GPU 的函数调用栈可剖析 LLM 训练和推理过程的性能瓶颈,例如显存申请/复制、卡内同步、卡间通信等操作的时间开销,从而帮助开发者提升 LLM 的 MFU(Model FLOPs Utilization);此项能力同样也可以用于其他 GPU 应用的性能优化,例如智能汽车中的自动驾驶、SLM 等场景。本次分享将会介绍 DeepFlow 中 eBPF Profiling 与 LLM/GPU 相互结合、双向驱动的实践和探索。

    向阳.jpg

    在演讲技术分享过程中,我们也希望通过线上线下互动的形式,让更多的技术专家和企业代表参与到Meet Up活动中来,扩大活动的影响力和覆盖面。




    Event Tags

    Recently Participation

    • 代畏
      Register

      (1个月前)

    • 邢华荣
      Like

      (1个月前)

    • 汪月
      Like

      (1个月前)

    • Simon.馮
      Like

      (1个月前)

    • Like

      (1个月前)

    • 支付宝开放平台
      Like

      (1个月前)

    Perhaps you'd be interested in

    Question

    All Questions

    Haven't posted any questions yet, grab a sofa!

    WeChat Scan

    Share to WeChat→

    免费发布