nokodoa
本站致力于IT相关技术的分享
在服务网格中关联 Sentry 与 Envoy 实现 JavaScript 应用的端到端可观测性 在服务网格中关联 Sentry 与 Envoy 实现 JavaScript 应用的端到端可观测性
一次线上故障排查,始于 Sentry 的一个寻常错误报告:Error: Request failed with status code 500。错误堆栈指向我们 Node.js 服务中的一个 HTTP 客户端,它在调用下游服务 user-s
2023-10-27
基于 Azure Functions 与 Weaviate 构建语义化日志分析的可观测性管道 基于 Azure Functions 与 Weaviate 构建语义化日志分析的可观测性管道
调试线上问题时,最先求助的总是日志。但随着系统变得复杂,传统的基于关键词的日志搜索,比如在 Kibana 或 Loki 里用 level:error AND "transaction failed" 这样的查询,越来越像
2023-10-27
利用eBPF构建对文档数据库的无侵入式性能观测管道 利用eBPF构建对文档数据库的无侵入式性能观测管道
我们团队的一个核心Node.js服务最近遇到了性能瓶颈,其后端依赖是MongoDB。应用性能监控(APM)工具的报告显示,某些API的P99延迟会周期性地飙升,但无法提供根本原因。问题在于,我们无法确定延迟是源于Node.js事件循环的阻塞
2023-10-27
在阿里云上为 Python 与 Kotlin 异构服务实现基于 tRPC 的统一可观测性链路 在阿里云上为 Python 与 Kotlin 异构服务实现基于 tRPC 的统一可观测性链路
团队接手了一个混杂技术栈的系统。核心数据处理模块是一个稳定运行多年的Python服务,基于Flask框架,我们称之为DataProcessor。最近,为了应对高并发查询场景,我们引入了一个新的Kotlin服务,QueryGateway,它使
2023-10-27
构建由BDD驱动的前端可观测性:集成Apollo Client与ELK Stack的实践复盘 构建由BDD驱动的前端可观测性:集成Apollo Client与ELK Stack的实践复盘
前端日志的混乱状态是一个长期存在的痛点。散落在代码各处的 console.log、缺乏上下文的错误信息、以及在生产环境中无法复现的“幽灵”问题,都让故障排查变成了一场噩梦。日志记录往往被视为一个次要的、事后的任务,导致其质量参差不齐,甚至在
2023-10-27