nokodoa
本站致力于IT相关技术的分享
在服务网格中关联 Sentry 与 Envoy 实现 JavaScript 应用的端到端可观测性 在服务网格中关联 Sentry 与 Envoy 实现 JavaScript 应用的端到端可观测性
一次线上故障排查,始于 Sentry 的一个寻常错误报告:Error: Request failed with status code 500。错误堆栈指向我们 Node.js 服务中的一个 HTTP 客户端,它在调用下游服务 user-s
2023-10-27
使用 Elixir Phoenix 构建连接 Swift 原生客户端与 LiveView 仪表盘的实时 MLOps 控制平面 使用 Elixir Phoenix 构建连接 Swift 原生客户端与 LiveView 仪表盘的实时 MLOps 控制平面
技术痛点在维护一个中等规模的 MLOps 平台时,我们面临一个日益尖锐的矛盾:模型训练和数据处理任务是长周期的、异步的,但开发人员和运维团队对任务状态的感知却要求是实时的。传统的方案,无论是让前端轮询 API,还是依赖批处理日志分析,都存在
2023-10-27
基于 AWS Lambda 与 Go 核心库构建 InfluxDB 高基数数据写入的弹性缓冲层 基于 AWS Lambda 与 Go 核心库构建 InfluxDB 高基数数据写入的弹性缓冲层
我们最初部署在 EC2 上的 InfluxDB 集群运行良好,直到业务需求引入了容器级别的监控指标。每个 Pod、每个容器的唯一 ID 作为 tag 涌入,时间序列的基数(cardinality)在几天内爆炸性增长了几个数量级。随之而来的是
构建基于 WebAuthn 身份的 Kubernetes 动态租户网络隔离方案 构建基于 WebAuthn 身份的 Kubernetes 动态租户网络隔离方案
在设计一个高安全性的多租户 SaaS 平台时,我们面临的核心挑战是如何实现真正意义上的租户隔离。传统的 Kubernetes 网络策略(NetworkPolicy)基于 Pod 标签和命名空间进行隔离,这在基础设施层面提供了基础防护,但在真
2023-10-27
结合 AWS SNS 与 Go 实现事件溯源投影层及 PostgreSQL 索引深度优化 结合 AWS SNS 与 Go 实现事件溯源投影层及 PostgreSQL 索引深度优化
我们的物联网设备管理平台在写入侧遇到了性能瓶颈。最初的架构是典型的 CRUD 模型,每次设备状态更新都会直接 UPDATE 一张巨大的 devices 表。随着设备量增长到数百万级别,高频的状态更新导致了严重的锁竞争和数据库 I/O 压力。
基于 GitOps 自动化部署 Trino 实现对 Loki 日志与 NoSQL 元数据的联邦化性能诊断 基于 GitOps 自动化部署 Trino 实现对 Loki 日志与 NoSQL 元数据的联邦化性能诊断
一个 Trino 查询突然变慢,Query ID 是 20231027_083000_12345_abcde。现在,你需要做什么?传统的做法是SSH到 Trino coordinator 和多个 worker 节点上,用 grep 在海量日
2023-10-27
5 / 5