扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2026-02-27 20:37

又一个草台班子?马斯克痛斥航天最严重安全事故

本文来自微信公众号: 快乘东风 ,作者:xi jiu,原文标题:《又一个草台班子?马斯克痛斥航天最严重安全事故!》


最近,美国NASA发布了一个非常重要的调查报告,报告将2024年波音公司在其Starliner载人飞船的首次载人试飞中,导致两名航天员滞留太空“9个月滞留”事件定为“Type A mishap”——要知道,这个就是NASA定义的安全事故里的最高严重级别。


为什么这个事件并无人员伤亡,依然被认定,问题的严重程度与当年的挑战者号/哥伦比亚号灾难相当呢?


这个报告对今天的航空航天等高科技企业有哪些重要的警示?对我们个人又有哪些值得学习借鉴的地方?我们从头来捋一遍。


事件时间线


这个9个月滞留太空事件,本来只是波音Starliner载人飞船的首次载人试飞,是一次短期认证测试,结果却成为现代载人航天中最引人注目的重大挫折之一。


关键时间线如下:


  • 发射:2024年6月5日—NASA两名宇航员乘坐Starliner发射。原计划总时长约8–14天,包括与国际空间站(ISS)对接和安全返回。


  • 飞行中问题:在接近和对接ISS期间(2024年6月6日),飞船推进系统出现严重故障:


  • 服务舱推进系统中出现多个氦气泄漏(氦气用于加压推进剂)。


  • 28个反应控制系统(RCS)推进器中多个失效或性能低下——一度有5个自动关闭,导致短暂失去完整的六自由度控制。最终宇航员手动恢复4个推进器,成功对接。


惊险时刻:失控瞬间,如果无法恢复,可能导致碰撞ISS或漂离轨道,威胁宇航员和站上人员安全。


•返回选择:


  • NASA最终判定让Wilmore和Williams乘坐Starliner返回风险过高,因为推进器和氦气系统的不确定性太大。


  • Starliner于2024年9月7日自主脱离并在无人的情况下安全着陆在新墨西哥州。


  • 两名宇航员作为扩展乘组留在ISS,避免启动紧急救援任务导致空间站人员不足。


  • 实际返回:他们最终于2025年3月18日乘坐SpaceX Crew Dragon返回地球。总在轨时间约286天(超过9个月),远超原计划。


过程凶险


以上这么个过程今天我们说起来可能很简单,但这期间的操作其实有很多凶险之处。


尤其是2024年7–8月Starliner返回决策会议上,不确定性引发了激烈辩论。这一时期涉及地面测试、内部会议和最终决策,决策过程高度敏感,因为任何错误判断都可能导致宇航员生命危险(如再入大气层失控或烧毁)。


从7月初开始,NASA和Boeing在White Sands Test Facility(新墨西哥州)进行地面测试,包括推进器热测试(模拟太空环境下的点火)和氦气系统分析。


结果测试报告显示,如果仓促决定载人返回,推进系统不确定性可能导致“再入烧毁或失控”(reentry failure),类似于Challenger的O型圈失效或Columbia的热防护破损。


NASA副局长在发布会中称:“我们差点有一个非常糟糕的一天”(We almost did have a really terrible day),指潜在致命风险。


NASA于2026年2月20日发布独立调查报告,全长约311页。这份报告最狠的一点是明确指出来:


硬件问题只是表象,真正的“癌症”是组织、文化、领导力失误。


NASA新局长Jared Isaacman公开说:“最令人不安的不是零件坏了,而是决策和领导力如果不改,会制造出和载人航天完全不相容的文化。”


  • 它把Starliner事件定为Type A mishap(和挑战者/哥伦比亚号同级),不是因为死了人,而是因为潜在致命风险+巨额损失+控制丢失,等于承认“差点就出大事”。


  • 这些组织推荐不是小修小补,而是要求制度性大变革:从合同模板、监督流程、异常管理,到文化培训,全都要改。


所以目前,波音的Starliner飞船等于目前仍处于停飞状态(禁止载人飞行)。下一任务计划不早于2026年4月—但仅为无载人货运/测试飞行,无宇航员上船,直到完成修复(新密封件、推进器重新设计、提升容错能力)并验证通过。



报告内容拆解-技术领域


具体来说,这份报告中指出足足61项正式整改措施,旨在全面解决Starliner Crewed Flight Test(CFT)暴露出的问题。


覆盖技术(technical)、组织(organizational)和文化(cultural)三大领域,目的是在下一次载人飞行前彻底整改,并为未来所有商业载人航天项目(如NASA的Commercial Crew Program后续)和政府主导的载人任务提供可借鉴的教训。


NASA局长Jared Isaacman明确表示:“NASA不会让任何一名宇航员乘坐Starliner飞行,直到技术原因彻底理解并纠正、推进系统完全合格、所有适当的调查推荐得到实施。”



措辞可谓非常严厉。


那么这三类问题具体指的哪些问题呢?


首先看技术领域(重点针对硬件与系统设计缺陷)。


简单说就是:Starliner飞船的“发动机”(推进系统)出了大问题,必须彻底修好硬件和设计上的毛病,才能让它安全地再载人上天。


其中推进系统最要命的几个毛病全部搞定。飞船上控制方向和姿态的小火箭发动机出了故障,导致差点失控:


  • 服务舱(飞船后半部分)的小火箭(叫SM RCS)老是自动关机;


  • 乘员舱(飞船前半部分,载人那块)的小火箭有一个不点火;


  • 氦气到处漏:漏的地方是密封圈(O型圈)坏了,因为材料和燃料不兼容,还因为圈的大小和安装槽的尺寸设计得不对。现在要重新设计这些密封零件,换更好的材料,反复测试确认以后绝对不会再多处漏气。


  • 飞船从太空返回地球时“刹车”能力不够保险:原来的设计只允许“一个地方出故障还能撑住”,但NASA要求必须“两个地方同时坏了还能安全回家”(双故障容错)。


再有就是:


测试飞船零件的方式要大升级(以前测试不够全面):以前只在实验室里测了部分条件,现在要求把太空里会遇到的所有极端情况都模拟一遍:比如超级热/冷、发动机开开关关很多次、飞船重复用、快速动vs慢慢动等等。不能让零件在测试没覆盖到的“极限外”偷偷工作,否则上天就危险。


飞船发回来的数据要更详细、更快:以前飞船传回地球的数据采样太慢、太少,像监控摄像头帧率太低,看不清到底哪里出问题。现在要提高“拍照”频率,让工程师能更清楚地看到每个小异常是怎么发生的,便于快速诊断和修。


整体安全分析要做得更严、更深:以前可能低估了某些问题的严重性(比如觉得“小故障没事”),现在必须从整个飞船系统角度重新检查一遍所有可能出事的点,确保没有把大风险当小事。


总结一句话:这些技术推荐就是在逼Boeing和NASA把飞船的“心脏和肌肉”(推进系统)从里到外翻新一遍,修零件、改设计、加保险、测更狠、看更清,直到它真正达到“载人航天必须万无一失”的标准。不是小修小补,而是大手术,目的是让下次宇航员坐上去时,大家都能放心。


报告内容拆解-组织领域:


该部分强调,技术故障虽为直接诱因,但组织层面的失效(如角色模糊和监督不足)放大了问题严重性。



主要的问题几个:


1.澄清共享责任模式,通俗的说,就是把“谁该为啥负责”彻底说清楚。


事实背景:在这个任务中,NASA采用的商业载人航天合同框架(Commercial Crew Program,)强调“共享责任”,但双方对角色、责任和风险所有权的理解存在系统性分歧。例如,Boeing作为主要承包商负责硬件开发和风险承担,而NASA仅提供高层次监督;然而,在推进系统异常发生后,返回决策会议中,Boeing倾向于接受更高风险以推进进度,NASA则要求更保守的验证,导致多次会议僵持不下,决策延迟数周。


定性分析:指出合同设计时的假设偏差:商业模式本意激励创新,但未充分预见高不确定性环境下的分歧。


跨行业启示:在核电或航空项目中,类似“共享责任”模式常见,但需通过合同附件明确定义风险矩阵和决策阈值。启示:建立联合责任治理委员会(Joint Accountability Board),定期审计角色一致性,避免碎片化导致的“决策瘫痪”。例如,FAA在波音737 MAX事件后引入类似机制,确保监管方与制造商的风险认知对齐。


2.加强NASA监督洞察,就是说NASA不能再当“甩手掌柜”。


事实背景:报告披露,NASA的“hands-off”合同模式(固定价格合同,价值超42亿美元)限制了对Boeing关键硬件开发的可见性,导致信息盲区。例如,推进系统密封件和推进器资格测试数据虽由Boeing提供,但NASA缺乏实时访问权限,无法独立验证潜在不相容性问题。CFT发射前,NASA仅依赖Boeing的自我报告,忽略了早期地面测试中的微弱异常信号;任务中异常暴露后,监督缺位进一步延迟了根因分析。报告引用数据:NASA对供应商二级数据的洞察率不足30%,远低于传统政府合同的水平。


定性分析:此“信息不对称”(information asymmetry)削弱了NASA的早期干预能力,导致潜在致命风险未被及时缓解。根因在于合同设计的权衡失误:追求成本效率牺牲了监督深度。


跨行业启示:在石油化工或大型基建(如高铁)中,监管机构应嵌入“强制可见性条款”(mandatory insight clauses),如数据共享平台或驻场审计。启示:平衡“hands-off”(放手不管)与“嵌入式监督”,例如欧盟在核设施监管中采用的“分层洞察模型”,确保关键子系统开发过程透明化,而不增加过度负担。


3.改进异常解决纪律,别再对“不明原因的异常”睁一只眼闭一只眼


事实背景:Starliner项目历史上反复接受“未解释异常”(Unexplained Anomalies,UAs),如2019年无人测试中的推进器问题和2021–2023年的氦气泄漏信号,未经彻底根因分析即被“豁免”。CFT任务中,这种惯性延续:对接前5个推进器失效虽被临时恢复,但未深挖poppet挤出等机制,导致返回风险评估偏差。报告记录了至少12起UAs被“反复接受”的实例,违反了NASA的异常管理标准(NPR 8621.1D)。


定性分析:这体现了“正常化偏差”(normalization of deviance)的文化动态,小异常被渐进接受,最终累积为系统失效。报告评估其影响为“极高严重性”,因为它直接导致了项目的潜在致命性。


其实挑战者号、哥伦比亚号、切尔诺贝利、波音737 MAX都栽在这上面。任何高风险行业都要把“零容忍未解释异常”当铁律。


4.组织整合与决策,组织别再像一盘散沙,决策要快、团队要信得过。


事实背景:CFT事件中,组织碎片化显露无遗:NASA内部多个程序(ISSP、Human Exploration and Operations)角色重叠,Boeing的分包链条复杂,导致决策链条冗长。报告引用2024年8–9月的返回选项会议:参与者达50余人,出现“防御性、不专业行为”(情绪化争执),信任崩塌,决策从原计划的数周延长至数月。最终,宇航员返回依赖SpaceX,暴露了内部协调失效。


定性分析:碎片化导致“决策瓶颈”(decision bottlenecks)和“群体极化”(group polarization),放大分歧并降低团队效能。、


跨行业启示:在航空或能源危机管理中,类似问题常见。启示:采用“矩阵式整合结构”(matrix integration),缩短决策路径,并通过模拟训练恢复团队信心。国际空间站项目后续已引入“统一指挥协议”,可供核电应急响应借鉴,确保碎片化不影响实时决策。


5.合同与风险管理,合同模式和风险评估要对齐,别各说各话事实背景:商业模式下,NASA与Boeing的风险评估标准分歧突出:Boeing的固定价格激励机制推动接受更高不确定性(推进系统容错不足),而NASA坚持“两故障容错”标准,导致合同执行中摩擦频发。报告分析了2014–2024年的合同修订历史,指出分歧未在早期解决,项目早就超支(Boeing亏损超15亿美元)。


定性分析:承包商与委托方目标不对齐。


跨行业启示:固定价格合同在高不确定性项目中容易出问题——承包商为了不亏本,就倾向“赌一把”。很多政府大项目(如军工、基础设施)后来都改成“成本+激励”或混合模式,避免把“赶进度”和“安全”对立起来


总之,报告将组织失效定性为“系统性文化与结构缺陷”。新局长Jared Isaacman强调,这些推荐要求“机构性变革”,包括领导层问责和文化审计。Starliner事件证明,忽略组织维度将放大技术风险,教训适用于任何依赖复杂合作的领域。



报告内容拆解-文化领域:


这部分问题最为关键。


1.转变NASA文化:从“优先供应商成功”转向“技术严谨优先”。


事实背景:报告揭示,项目的文化长期倾向于“provider success”(供应商成功),即优先确保Boeing Starliner项目按商业模式推进并实现认证,以维持双提供商(Boeing与SpaceX)竞争格局。这种文化“将供应商成功置于技术严谨之上”。


2.消除信任侵蚀与不专业行为。


事实背景:报告基于访谈与会议记录,详细描述了2024年7–9月返回选项讨论中的“不专业行为”,包括“会议中吼叫”、“情绪化且无生产性”、“防御性姿态”(defensive postures),以及安全工程师在静音麦克风下被斥责。Isaacman在发布会中称这“恶化成不专业行为”,并指出NASA与Boeing间信任侵蚀源于选择性数据共享、感知到的偏袒与不一致透明度。报告引用匿名证词:“这是我经历过的最丑陋的环境”。


初期分歧放大为情绪冲突,进而抑制开放沟通与异见表达。报告评估其为“极高严重性”,因为它直接阻碍了基于证据的决策,导致延迟并放大风险。


3,缓解进度压力。


事实背景:Starliner项目经历了超过30次发射尝试延期(从2017年目标推迟至2024年),导致“累积进度压力”(cumulative schedule pressure)和“决策疲劳”(decision fatigue)。报告指出,这种长期紧迫感限制了风险降低举措、造成员工疲劳,并加剧信任下降。Isaacman强调,进度压力环境使团队难以维持客观风险评估,并在CFT中表现为对异常的容忍度提高。


报告将文化失效定性为“最核心问题”,贡献于事件大部分可避免风险。



SpaceX及马斯克的态度


值得一提的是SpaceX在Boeing Starliner事故中的作用。


作为NASA Commercial Crew Program的另一提供商,SpaceX的Crew Dragon自2020年起已执行多项ISS轮换任务。在CFT事件中,SpaceX调整了Crew-9任务配置,包括预留额外座位,以适应救援需求。这体现了商业载人航天模式的冗余设计,SpaceX的垂直整合和快速响应能力(如快速生产和测试)与Boeing的延误形成对比。


Elon Musk作为SpaceX CEO,在X(前Twitter)平台和公开采访中多次评论Starliner事件,焦点在于Boeing的管理问题、NASA决策的政治影响,以及监管机构的偏见。


  • 对Boeing管理结构的批评:Musk指出Boeing延误的根因在于“太多非技术经理”(too many non-technical managers)和官僚主义结构,因为Boeing大量收入依赖政府合同,导致效率低下。他建议Boeing应改革组织结构,减少层级,优先技术严谨性而非行政管理,以匹配政府之外的创新需求。Musk进一步表示,Boeing的系统“奖励延误而非进步”(rewards delay,not progress),并允许其“耗尽NASA预算”(drain NASA’s budget)而未问责。建议:Boeing需重建激励机制,鼓励工程师主导决策,避免“阻抗匹配政府”(impedance match to the government)的低效模式。


  • 对FAA监管的批评:Musk批评FAA(Federal Aviation Administration)对SpaceX施加“琐碎罚款”(fines for trivia),而对Boeing的Starliner安全问题“免费通行”(free pass)。他指出,NASA已判定Starliner不安全,却未罚Boeing“将宇航员置于风险中”(putting astronauts at risk)。建议:FAA领导层应辞职,并将资源转向真实安全问题;监管应公平应用,避免针对SpaceX的“骚扰”(harassing)。这与他的X帖子一致,强调FAA忽略Boeing的系统性失效。


正如报告中结语所强调的:“技术卓越、透明沟通和清晰角色责任不是最佳实践,而是人类航天成功的必需条件。


这其实值得所有人谨记。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

大 家 都 在 搜