评审意见
农用轮胎纵向垂向载荷估计方法研究与试验验证
孙瑞 · 工学博士(车辆工程 · 智能农机装备方向)· 中国农业大学,导师朱忠祥教授
论文定位
本文在 14.9R26 子午线农用驱动轮胎的胎冠与胎侧内壁各周向布设 20 个应变传感器(共 40 通道),用低成本胎内应变阵列加自研自走式单轮测试平台,间接估计轮胎的纵向力与垂向载荷,作为对昂贵六分力传感器的可负担替代。论文自研了 BSSR-Net(异常应变重建)与 AVTLE-Net(载荷估计)两套网络,在 40 余万样本数据集上做对比与消融,并在柏油硬路面、玉米留茬地、旋耕地、犁耕地四种作业路面做实车验证。属"实验室机理建模加田间试验验证"型工作;6.3 节已主动把传感器耐久性与工程化、六分力扩展、水田雪地极端场景、实时嵌入式部署列为未来工作。下述意见均在此定位内提出。
论文工作量大、试验链条完整、自我边界意识较强。以下 5 条意见按强度排列——1 条主要、4 条讨论级,后者多为作者可部分回应、但评审时应当点明的问题,每条都客观附上作者可能的解释。
意见一 · 摘要/结论的"多速度工况"措辞,超出了实验数据主要
维度:逻辑性 / 试验数据 | 定位:中/英文摘要第(2)条、6.1 节,对照表4-1、表4-2、5.5 节四个验证小节
原文:摘要写"在田间路面条件下采集了不同胎压、载荷、速度等多工况试验数据"(英文 "under varying inflation pressures, loads, and travel speeds");而表4-1"速度/(km/h)"栏只有单一数值 5,表4-2 全部四个胎压档样本均为速度 5 km/h,5.5 节四个验证小节也一律"测试速度为 5 km/h"。另在 4.2.2 节又称"由于采集过程中车速的动态变化……这可使模型自主学习车速与载荷动态关联的隐含特征,从而提升泛化能力"。
问题:摘要与结论把"速度"列为与胎压、载荷并列的受控变化工况维度,英文更直接写成 "varying travel speeds",但训练集与全部验证集的设计速度都只有 5 km/h 一个点。一篇博士论文里,"采集了不同速度工况"与"只在 5 km/h 采集"不能并存。
为什么是问题:这是读者从表4-1/表4-2 一眼能抓到的内外不一致,直接影响对"多工况"贡献和泛化结论可信度的判断。
修改建议:把摘要(中/英)和 6.1 节里"速度"从"受控变化工况"的并列项中删除,或改写为"恒定 5 km/h 下的微速度波动";若确有多速度数据未列入,则补进表4-1/4-2 并给出各速度的样本量与精度;4.2.2 节那句需与单速度事实对齐或删去。
意见二 · 训练数据来自单一地块、单日、单一土壤状态,与"多种土壤条件"的概括不符讨论级
维度:试验数据 / 逻辑性 | 定位:4.1.1 节与表4-1/4-2,对照 6.1 节(1)
原文:4.1.1 写"试验场地设在沈阳市于洪区青堆子村休耕的玉米农田中……土壤类型为典型黑钙土……属典型耕作前农田状态",4.1.2 给出单次测量的环境温度 8.2℃、湿度 65.6%、土壤含水率 14.15% 等固定值;而 6.1 节(1)却概括为"采集了……多种土壤条件下的轮胎应变数据"。
问题:40 余万训练样本数量虽大,但全部来自同一地块、同一土壤状态的一次性采集,土壤温湿度、轮胎温度与磨损在训练分布里几乎不变,真正变化的只有胎压、垂向载荷、纵向载荷三个量。6.1 节"多种土壤条件"的措辞与 4.1.1 的单地块事实对不上。
为什么是问题:训练分布的单一性是数据驱动模型外推能力的天然边界,博士论文里应被显式讨论。需要说明的是,这不是批评 5.5 节的跨路面验证——四种路面的独立测试恰恰是本文优点,不应否定;这里指的是"训练分布只有一种土壤状态"。
修改建议:6.1 节把"多种土壤条件"改为与 4.1.1 一致的"单一玉米休耕地(黑钙土)";并补一段说明训练分布在含水率/紧实度/温度/轮胎磨损维度的单一性,明确"跨这些维度的泛化由 5.5 节分布外试验间接检验,完整覆盖留待未来工作"。
意见三 · 载荷真值全部来自测试平台自身的力传感器,从未做一次独立交叉校核讨论级
维度:试验数据 | 定位:3.3.4 节与表3-13、4.1.2 节、5.5 节,对照 1.2.4 节
原文:4.1.2"轮胎所受垂向载荷与纵向牵引力则分别由垂向力传感器与纵向力传感器实时测量";5.5.1"将其与试验平台得到的真实值进行对比"。而 1.2.4 自己也写"六分力传感器测量精度高……但其价格极为昂贵……改后轮胎的刚度特性与原胎存在差异"。
问题:全文的"真值"——既是两套网络的训练标签,也是四种路面验证里 MAPE/MAE 所对照的基准——自始至终来自测试平台自身的轮辐式压力传感器与 S 型拉压力传感器,没有任何一组用独立手段(哪怕一次六分力仪、标准砝码静态标定、或第三方测力轮)交叉校核,也未讨论这套参照本身的测量不确定度如何传播到最终 MAPE。
为什么是问题:当模型报出垂向载荷 MAPE 1.83% 这类精度时,其分母(真值)的可靠性决定了这些数字的意义;若参照本身有系统偏差,"高精度"可能只是"与平台力传感器一致"。答辩委员会很可能追问。
修改建议:补一次独立校核(如静态加载下用标准砝码/标定测力机比对力传感器),或至少增写一段,基于表3-13 的 FS 精度估算参照值不确定度,说明它对报告 MAPE 的量级影响,以界定"高精度"结论的适用范围。
意见四 · 对比基线网络是否同样接受 BSSR-Net 重建后的输入,未交代,影响对比公平性讨论级
维度:逻辑性 / 试验数据 | 定位:5.3.2 节(基线 MLP/CNN/TCN 对比),对照 5.4.1 消融
原文:5.3.2"在 3 个对比网络中,将 20 个胎面应变传感器与 20 个胎侧应变传感器的共计 40 条时序数据沿特征维度进行拼接,作为网络的输入";5.4.1"BSSR-Net 的移除导致网络性能下降最为显著……精确重建原始传感器应变信号是后续载荷估计的基础"。
问题:5.3.2 把 AVTLE-Net 与三个基线比,只说基线"将 40 条时序数据拼接作为输入",没说这 40 条是否已经过 BSSR-Net 异常重建。而消融实验证明 BSSR-Net 对最终精度贡献最大。如果对比时本文方法用的是重建后输入、而基线用的是未重建输入,则"本文方法最优"有一部分来自 BSSR-Net 这个前置模块,而非主干网络本身,比较口径不完全对等。
为什么是问题:这关系到"AVTLE-Net 显著优于基线"这一核心结论的归因,读者会问:基线拿到的是同一份(重建后)输入吗?
修改建议:在 5.3.2 用一句明确"本文方法与三个基线接受完全相同的输入(同一份 40 通道预处理数据)",消除归因歧义;若此前确实只给本文方法用了重建输入,则需补做同输入条件下的对比。
意见五 · 把"连续平缓波动工况下更优"作为优点陈述,实质是"在最均匀路面上表现最好"讨论级
维度:逻辑性 | 定位:摘要末句、英文 Abstract 末句,对照 5.5.4 节与表5-2
原文:摘要"且在连续平缓波动载荷工况下估计性能更优";表5-2 四工况 MAPE 为 柏油 1.88、旋耕 2.51、玉米留茬 2.97、犁耕 3.43;5.5.4"犁耕土壤是测试的四种工况中模型估计误差最大的工况……垂向载荷 MAPE 在 18 kN 处跃升至 5.68%,MAE 达 1024 N,表明该工况已达到模型的性能边界"。
问题:把"在连续平缓波动工况下更优"写成模型的性能卖点。但从表5-2 看,这等价于"路面越平整、激励越规则,精度越高;越接近真实复杂田间作业(留茬、犁耕),精度越低",在最具农业代表性的犁耕工况下垂向载荷局部 MAPE 已达 5.68%、MAE 超 1000 N。用正面口吻表述,容易让读者忽略"恰恰在最需要估计的复杂作业工况下表现最差"。
修改建议:摘要/结论在"连续平缓波动工况下更优"之后补一句中性限定,如"而在留茬、犁耕等强瞬态冲击的复杂作业工况下估计误差上升,犁耕垂向载荷局部 MAPE 达 5.68%,为当前模型的性能边界",避免只呈现有利的一面。
总体意见
这是一篇工作量大、试验链条完整(机理分析 → 有限元 → 自研感知硬件 → 自走平台 → 数据集 → 自研双网络 → 消融 → 四路面验证)、达到博士水平的论文。本轮提出 1 条主要问题(摘要/结论"多速度工况"措辞与单速度事实自相矛盾)和 4 条讨论级问题(训练分布单一性、载荷真值无独立校核、对比基线输入口径未交代、"平缓工况更优"的选择性正面措辞),均可引出原文,且作者多半能部分回应,属于"应在评审中点明、并公允附上作者解释"的范畴,不影响论文整体成立。建议修改后答辩。