Zhihang Xie (@zhihangxie.bsky.social)

ReShape Attention bridges speech & text models without extra parameters. Achieves +8.5% BLEU in translation by leveraging acoustic cues, outperforming cascade/E2E methods. Efficient & scalable. Check the paper by Kano et al. (2025) at: ieeexplore.ieee.org/stamp/stamp.....

loading . . .

IEEE Xplore Full-Text PDF: https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=10888650&casa_token=Kruk-pUrXgAAAAAA:8YIAYbDEVjIAsXZRGHynjbWqnsIUPoZO1cdRPqUhiYS4sEjkCMC10kiEV1W32QvLk9ysHgrHqA

about 1 year ago