ユーザーエージェントが視覚的トラックの代替テキストを自動的に読み上げることができるまでは、重要なマルチメディア情報の視覚的トラックには聴覚的な説明を付けなければならない。W3Cのガイドラインは等価物の備考の部分には次のように書かれている。「非テキスト等価物の例として、表現の主要な視覚的要素の聴覚的説明があります。説明は、あらかじめ録音された人間の声または合成音声(録音または動的生成)のいずれかです。聴覚的説明は、表現のオーディオ・トラックと同期しており、通常はオーディオ・トラックの自然なポーズ中に行われます。視覚的説明は、行動、身体言語(ボディー・ランゲージ)、グラフィックス、場面変更などに関する情報を含んでいます。」