
业务背景:一场“硬核双11”把MySQL干翻了

数据库是离用户最远、又离系统最近的那一层。平时它安静运转,没人会注意;只有在百万人同时涌进来的那一刻,它才决定了一个产品是稳如磐石,还是当场白屏。
平凯星辰(PingCAP)是天际长期陪伴的企业。这家 2015 年成立的公司,做出了全球活跃度排名前列的开源分布式数据库 TiDB,又在这套内核之上打磨出面向企业级关键业务的平凯数据库,如今服务着金融、政务、能源等行业的数千家机构。当 AI 和数字化把数据量推向新的量级,一个能扛住极限并发、又能弹性扩展的数据底座,是几乎所有上层应用的前提。
下面这篇来自平凯数据库的实战复盘,完整记录了郑州市民卡 APP 从 MySQL 全面切换到 TiDB 的过程。百万人同时抢券、公共服务零容错,这样的民生场景,恰恰是检验一款分布式数据库最严苛的试金石。
郑州市民卡APP是真正的惠民应用——绑定社保卡就能一卡通办,涵盖公积金查询、养老社保、交通充电、跑腿服务、文旅消费等几乎全部生活场景。每年11月,政府联合发放的200元大礼包消费券活动一启动,峰值200万市民同时涌入抢券。结果,原有的MySQL主从架构瞬间崩溃:页面白屏、加载失败、投诉量暴增,用户体验直接崩盘。

MySQL主从架构暴露的四大致命痛点:
1. 高并发性能严重不足
抢券瞬间流量洪峰,MySQL读写双双过载,数据库频繁卡死。
2. 主从延迟导致数据不一致
APP实行三级用户体系(手机号注册 → 实名认证 → 绑定社保卡)。高峰期主从复制延迟严重,用户等级状态无法及时同步,导致大量用户明明符合条件却抢不到券,体验极差。
3. 扩容困难,严重侵入业务
只能通过加从库扩展,垂直扩容天花板低;分库分表改造又要大规模改动业务代码,成本高、风险大。
4. 可用性差,公共服务零容错
主库一旦故障,必须人工切换从库,切换期间整个APP不可用。对于民生服务来说,这是完全不能接受的。
团队从2019年开始接触TiDB,已积累7年落地经验。在这次危机面前,他们果断决定:全面切换到TiDB。

为什么选择TiDB?分布式数据库的硬核优势


经过技术选型和压测评估,团队最终选择了TiDB作为核心数据库替代方案。其核心优势完美匹配高并发民生场景:
1. 计算存储分离,真正弹性扩容
TiDB采用 PD + TiDB Server(计算)+ TiKV(存储)三层架构,计算和存储可独立水平扩展。通过SLB负载均衡,扩容过程业务完全无感知。
2. 原生分布式,彻底告别主从延迟
数据自动按Region(96MB)打散分布,不存在传统主从复制延迟问题。用户状态变更实时全局可见,完美解决抢券场景下的数据一致性难题。
3. 多副本高可用,故障自动自愈
支持三副本/五副本机制,单个节点故障不影响服务。TiDB Server无状态,剩余节点可持续提供服务,无需人工介入切换。
4. 完整生态工具链,开箱即用
TiUP 一键部署、Dashboard 监控、DM 数据迁移、TiCDC 数据同步、Prometheus + Grafana 告警等工具一应俱全,大幅降低运维复杂度。

迁移落地:从MySQL到TiDB的完整平稳方案


1. 数据迁移:DM工具实现全量+增量同步
使用 DM(Data Migration)完成全量数据迁移 + 实时增量同步,双库长期并行运行。
TiCDC 支持反向同步回MySQL,万一切换出问题可快速回滚,双保险机制。
迁移完成后,通过 sync-diff-inspector 工具进行全量数据校验,确保零差异。
2. 迁移前充分预演
在预发环境多次复刻线上峰值流量,完整进行压力测试、迁移演练和故障切换演练,做到万无一失。

生产环境深度优化实践

1. 混合部署 + 内存精细调优
受硬件限制采用混合部署模式:TiKV Block Cache 控制在45%左右,TiDB Server 和 TiKV 分别绑定不同 NUMA 节点,最大化资源利用率,避免 OOM。
2. 热点问题解决:自增ID 改为 AUTO_RANDOM
将主键从AUTO_INCREMENT 改为 AUTO_RANDOM,彻底打散写入热点,峰值写入性能显著提升。
3. 慢查询与统计信息优化
利用 TiDB Dashboard 监控慢查询;对超大表降低统计信息采样率(从默认10%降至0.1%~1%),减少统计采集对业务IO的冲击。
4. 冷热数据分离存储
热数据(抢券记录、活跃用户)放在SSD高性能盘,冷历史数据放在HDD低成本盘,兼顾性能与成本。

迁移成果:效果立竿见影

抢券活动零故障:多场百万级抢券活动期间,数据库再未出现过崩溃、白屏、延迟等问题,用户投诉大幅下降。
运维成本大幅降低:节点故障自动恢复,无需人工介入,DBA工作量显著减少。
线性水平扩容:集群从3节点轻松扩展到5节点,性能平稳,用户增长不再焦虑。


经验总结 & 未来展望

三条硬核落地建议:
1. 数据库一定要用SSD,HDD完全发挥不出TiDB的分布式性能。
2. 迁移前必须做充分的压力测试和故障演练,绝不建议裸切。
3. 善用TiDB全家桶工具(DM、TiCDC、Dashboard、TiUP等),实现数据全生命周期高效管理。
未来规划:
引入 TiFlash 列式存储引擎,满足海量民生数据的OLAP分析需求;
探索 TiDB Serverless 无服务架构,进一步降低资源成本;
打造AI驱动的智能化运维平台,实现故障自动定位与弹性扩缩容。
————✦往期回顾✦————
AI 数据复盘:连 ChatGPT 都不涨了,到底是什么原因|直播回顾
SpaceX600亿美元买走Cursor之后, AI应用真正值钱的是什么?

天际科技投资(FutureX Capital)由前华夏基金私募股权创始团队于2018年初主导创立。公司专注于投资中国早中期高新科技企业,重点聚焦颠覆式创新的卓越企业,重视价值创造,聚焦产业赋能,深度参与到企业发展的全周期。全球创新技术含金量最高的公司和快速爆发下游应用是天际科技投资最关注的目标企业,并善于将这些先进技术公司推向产业平台,协助其进一步发挥潜力。代表性投资包括:金山云,字节跳动,美团,蔚来汽车,PingCAP,统信,思特威,芯盟科技,开源中国等。
天际科技投资秉承开源理念,不断吸引广泛的产业资源、金融资源和专家网络,与顶级企业家进行多方位的交流与合作,汇聚顶级认知,形成前瞻性洞见和跨行业合力,通过不断提升认知,持续发掘改善世界的投资机会。

————✦ 关注我们 ✦————
小红书 / 视频号 / 抖音:倩姐投AI小宇宙:P人客廳
Twitter: @futurex_capitalLinkedIn: FutureX Capital
官方视频号 / 公众号:天际科技投资