在 Arduino IDE 實作 AudioClassification 時的 not align to 0x20 錯誤求助

大家好,我是語音辨識開發的初初入門使用者,先感謝大家的協助。
我在 Edge Impulse 網站訓練了關鍵詞語音模型,下載 Quantized (int8) 或 Unoptimized (float32) 的 .tflite 檔並使用 Ameba_acuity_toolkit 順利產生 .nb 檔,
但是在 Arduino IDE 中使用 AudioClassification 範例來測試載入 .nb 檔時,Serial Monitor 最後就是不斷出現 not align to 0x20 的錯誤資訊。
請問是否在編輯 marabari_va_inputmeta.yml 檔案時,針對關鍵詞語音辨識有一定的設定規則呢?
還是在 Edge Impulse 網站產生特徵或是訓練模型應該注意那些細項呢?
已測試了在 Edge Impulse 嘗試各種提取特徵的組合 MFCC, MFE, classifler, keyword-spotting 等等,然後訓練生成各種模型,並在AI的協助下修改各種版本的 marabari_va_inputmeta.yml 來匯出 .nb 檔。

== Rtl8735b IoT Platform ==
[Normal mode]
BootFromNORFlash
[Start Boot ROM…]
=== Load PARTBL ===
=== Load Done ===
=== Load ISP_IQ ===
[fcs chk pass]
ISP_IQ @ 0x8461080, 0x2ff80, 0x0
mfcs_data version 0x00010001
fcs_data version 0x00010101
=== Process ISP_IQ ===
=== Load Done ===
=== Load BL ===
[Image Start Table @ 0x18200]
=== Load Done ===
== Boot Loader ==
Mar 25 2025:14:12:02
=== Load FCS Para ===
=== Load Done ===
[crc pass]
=== Load ISP_IQ Sensor ===
ISP_IQ @ 0x8461080, 0x2ff80
=== Process ISP_IQ ===
=== Load Done ===
=== Load FW1 ===
FW_ISP_IQ @ 0x8061080, 0x31f80
=== Process FW_ISP_IQ ===
DRAM_TYPE is DDR2 128MB.
ddr_freq = 533
VOE flash @ 0x8093080, 0x80f80
FCS KM_status 0x00002081 err 0x0000200a
Wait KM fcs done 0 us
FCS TM_status 0x003f0000
store fcs data for application
It don’t do the sensor initial process
RAM TM_STATUS 0x00bf1208 err 0x00001208
read fcs_status 0x000000bf
read fcs_status 0x000000bf
=== Process VOE IMG ===
[Image Start Table @ 0x20106200]
RAM Load @ 0x8114100->0x20106200, 0x5a28
DDR Load @ 0x811a080->0x70100000, 0x78695
=== FW Load Done ===
Boot Loader <==
== RAM Start ==
Build @ 18:41:56, Sep 23 2025
set ASP print off

$8735b>set ASP print off

=========================================

====== Ameba Pro2 語音分類標準模式 ======

[INFO] 麥克風硬體初始化完成。
npu[12345678] vipdrv vip_drv_init, video memory heap base: 0x75c00000, size: 0x02400000
NN IRQ default priority : 0, set to 9

npu[12345678] HASHMAP 0x->7018ee50(process-ID) INIT SUCCESS
npu[12345678] DATABASE 0x->7018ff5c(task-desc) INIT SUCCESS
npu[12345678] DATABASE 0x->7018ff08(memory-mgt) INIT SUCCESS
vfs_mutex init
fatfs register
Enable the emmc interface 0
sd mount
Register disk driver to Fatfs.

FATFS Register: disk driver 0

SD_Init 0

part_count = 0

input count 1, output count 1

input param 0

data_format 1

memory_type 0

num_of_dims 2

quant_format 0

quant_data , none-quant

sizes 3960 1 0 0 0 0

output param 0

data_format 1

memory_type 0

num_of_dims 2

quant_format 0

quant_data , none-quant

sizes 7 1 0 0 0 0


HASHMAP ->70210720(record-list) INIT SUCCESS
[INFO] NPU 內部模型初始化完成。
[SUCCESS] 管道鏈結成功!開始監聽喚醒詞…
[0x12345678]vip_create_buffer_from_handle[311], fail handle_size=0x1ef0 not align to 0x20
error: error: vip_create_buffer_from_handle fail.
[0x12345678]vip_create_buffer_from_handle[311], fail handle_size=0x1ef0 not align to 0x20
error: error: vip_create_buffer_from_handle fail.
[0x12345678]vip_create_buffer_from_handle[311], fail handle_size=0x1ef0 not align to 0x20
error: error: vip_create_buffer_from_handle fail.

Hi @rick-kh ,

您好, 請問您是使用YAMNet 模型嗎? 如果方便的話, 可以提供您的模型讓我們測試看看嗎

謝謝

最近這次轉出來的 .nb 檔,麻煩你了

這是在 EdgeImpulse 用自己上傳的語音詞錄音,使用 MFCC, classifler, 產生特徵訓練然後轉檔的。

network_binary.zip (19.4 KB)