Atra Integrated Demo v12

Atraの目・聴覚・収束を1つにした単体デモ。映像は visual traces として差分枠で追い、音声は waveformspectrogram / voiceprint で観察し、テキストも同じ場の text_delta として Learn / Recall する。 画像認識・顔認識・音声認識・文字起こし・正解ラベル化はしない。
Integrated standalone demo for Atra visual traces, auditory waveform, spectrogram / voiceprint, text cue recall, and Associatron-style convergence.

1. Atra Eye / Visual Traces / Atraの目

日本語: 映像そのものを覚えるのではなく、フレーム間の差分から「動いた場所」を枠として出します。 枠は人・顔・物体名の認識ではありません。visual traces の観察表示です。この版では視覚差分を12×8に上げています。
English: This does not remember raw video. It extracts changed regions between frames and draws boxes. Boxes are not person, face, or object recognition. They are observer display for visual traces. This version uses a 12×8 visual delta grid.

Visual delta map / 視覚差分マップ

2. Atra Auditory Pre-stage / 聴覚前段

日本語: ここでは文字起こしをしません。音声を「言葉」として理解せず、waveformspectrogram / voiceprint を観察します。 Atraに渡すのは音量、アタック、周波数分布の粗い auditory_delta です。
English: No transcription. Sound is not treated as words. The demo observes waveform and spectrogram / voiceprint. Atra receives only rough auditory_delta such as energy, attack, and frequency distribution.

Waveform / 波形

Spectrogram / Voiceprint / 声紋

3. Text Cue / テキストcue

日本語: テキストは入力できます。これは正解ラベルではなく、同じ場に入る text_delta です。 Learn時に直近8秒の映像・音とテキストを同時に覚えます。あとでテキストだけ入力して Recall することもできます。
English: Text can be typed. It is not a correct label, but text_delta in the same field. On Learn, visual and audio traces from the recent 8 seconds are stored together with text. Later, text alone can be used as a cue for Recall.
Learn rule / 学習操作:
1つの経験につき Learn は1回だけ押す。連打すると同じ痕跡が強くなりすぎる。
Press Learn once per experience. Repeated pressing over-strengthens the same trace.
Recall does not stop live visual/audio sensing. / Recallしてもライブの視覚・聴覚センサーは止めない。
Atra voice leak / Atraの声の漏れ
日本語: これは入力テキストをそのまま読む機能ではありません。Recallで近い痕跡が立ったあと、 直前のRecallで立った痕跡パターンだけから、Web Audioで raw voice leak を鳴らします。Text Cue欄も学習テキストも読みません。 男の子/女の子は声質プリセットで、実際の声はブラウザとOSに入っている音声に依存します。
English: This is not direct text reading. After Recall finds a close trace, human text / note is loosened into a hesitant raw voice leak. This does not use Text-to-Speech for the leak. Boy / girl change the raw tone range; Speak text remains only for comparison.
visual traces / 視覚痕跡0.000
audio energy / 音圧0.000
text pressure / 文字圧0.000

Learn readiness / 学習準備状態

visual buffer / 視覚バッファempty
audio buffer / 聴覚バッファempty
text buffer / テキストempty

4. Associatron / アソシアトロン

Associatron memory matrix / アソシアトロン記憶行列:
Tij = Σ xixj,   Tii = 0

Cue recall / cueからの想起:
y = clamp(xcue, sign(Txcue))

Energy of the memory field / 記憶場のエネルギー:
V = − 1/2 Σ Tijxixj

5. Log / Recall

Waiting. / 待機中。