AI交互的未来:从低带宽的语言到高带宽的视觉
Published:
现在AI都是LLM based,全都是语言。而人的阅读速度是有限的,尤其是非母语的时候,阅读速度更慢。读,和听,都是低带宽的。
而视觉是最高带宽的。人眼的输入带宽特别高,然后人脑把超高带宽的信息超有效的压缩到非常低的带宽,并提取有效信息。
新的人和AI的交互方式,应该在视觉上进行突破。既然AI擅长写代码,写code,可以让AI生成更具有总结和信息压缩能力的图表。AI生成的那么大段大段的文字,根本看不过来。
从代码 Diff 到视觉 Diff:理想的交互情景
理想情况下,AI 应该能够返回一个“图图对比”,而不是代码层面上红绿颜色的增删对比。最终的呈现结果不应是大段文字,而是一个可交互的 HTML 格式的 Dashboard,里面包含柱状图、小提琴图 (Violin Plot) 等各种直观的可视化元素。
这是“AI 作为智能协作者”交互方式的必然演进方向:从“代码级的红绿 Diff”进化到“语义和视觉级的 Diff”,从“线性文本框”进化到“交互式 Dashboard”。
为什么现在的图表生成体验不够好?
目前这种情景在技术上已经初步实现,但经常遇到图表质量不稳定、排版崩溃 (Collapse)、不够美观或者抓不到重点等问题。原因在于当前 AI 技术的边界和痛点:
- AI 是在“盲写” (缺乏视觉闭环): 目前的 LLM 生成代码时依靠的是逻辑概率,它“看”不到最终渲染出的像素。它不知道 X 轴标签重叠了,不知道颜色搭配是否刺眼,或者某个 Flex 容器在特定分辨率下塌陷了。它在输出代码,而不是在输出画面。
- “重点”属于隐性知识 (Tacit Knowledge): 数据是客观的,但“想表达什么”是主观的。数据结构可以被轻易解析,但人类关于“肥尾效应”或特定业务视角的洞察重点,AI 很难凭空猜透。
- 高度脆弱的排版系统: 前端 UI(尤其是复杂的 Dashboard)牵一发而动全身,一个样式的冲突就会导致全局崩溃。AI 处理纯逻辑的稳定性,目前远高于处理全局 CSS 状态的稳定性。
未来的 AI 交互,必然需要解决这些“最后一公里”的体验问题,让 AI 不仅能写代码,更能“看”懂它生成的画面。

Leave a Comment