AI交互的未来：从低带宽的语言到高带宽的视觉

less than 1 minute read

Published: June 07, 2026

现在AI都是LLM based，全都是语言。而人的阅读速度是有限的，尤其是非母语的时候，阅读速度更慢。读，和听，都是低带宽的。

而视觉是最高带宽的。人眼的输入带宽特别高，然后人脑把超高带宽的信息超有效的压缩到非常低的带宽，并提取有效信息。

新的人和AI的交互方式，应该在视觉上进行突破。既然AI擅长写代码，写code，可以让AI生成更具有总结和信息压缩能力的图表。AI生成的那么大段大段的文字，根本看不过来。

理想情况下，AI 应该能够返回一个“图图对比”，而不是代码层面上红绿颜色的增删对比。最终的呈现结果不应是大段文字，而是一个可交互的 HTML 格式的 Dashboard，里面包含柱状图、小提琴图 (Violin Plot) 等各种直观的可视化元素。

这是“AI 作为智能协作者”交互方式的必然演进方向：从“代码级的红绿 Diff”进化到“语义和视觉级的 Diff”，从“线性文本框”进化到“交互式 Dashboard”。

目前这种情景在技术上已经初步实现，但经常遇到图表质量不稳定、排版崩溃 (Collapse)、不够美观或者抓不到重点等问题。原因在于当前 AI 技术的边界和痛点：

AI 是在“盲写” (缺乏视觉闭环)： 目前的 LLM 生成代码时依靠的是逻辑概率，它“看”不到最终渲染出的像素。它不知道 X 轴标签重叠了，不知道颜色搭配是否刺眼，或者某个 Flex 容器在特定分辨率下塌陷了。它在输出代码，而不是在输出画面。
“重点”属于隐性知识 (Tacit Knowledge)： 数据是客观的，但“想表达什么”是主观的。数据结构可以被轻易解析，但人类关于“肥尾效应”或特定业务视角的洞察重点，AI 很难凭空猜透。
高度脆弱的排版系统： 前端 UI（尤其是复杂的 Dashboard）牵一发而动全身，一个样式的冲突就会导致全局崩溃。AI 处理纯逻辑的稳定性，目前远高于处理全局 CSS 状态的稳定性。

未来的 AI 交互，必然需要解决这些“最后一公里”的体验问题，让 AI 不仅能写代码，更能“看”懂它生成的画面。

Deep Dive vs. Professional Orchestration: My Reflections on the AI Efficiency Paradox