一種多媒體采集裝置和方法
基本信息

| 申請?zhí)?/td> | CN201210283273.2 | 申請日 | - |
| 公開(公告)號 | CN103581606B | 公開(公告)日 | 2018-09-07 |
| 申請公布號 | CN103581606B | 申請公布日 | 2018-09-07 |
| 分類號 | H04N7/14;H04N7/15;H04N5/232;G10L15/06 | 分類 | 電通信技術; |
| 發(fā)明人 | 孫敏剛;趙照 | 申請(專利權)人 | 北京維鯨視界科技有限公司 |
| 代理機構 | 北京市隆安律師事務所 | 代理人 | 北京維鯨視界科技有限公司 |
| 地址 | 100085 北京市海淀區(qū)上地三街9號C座C612 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本發(fā)明公開了一種多媒體采集裝置和方法,屬于多媒體領域。裝置包括:音頻采集單元,包括至少四個采集通道,用于采集發(fā)言者的發(fā)出的音頻信號;音頻分析單元,用于將采集到的發(fā)言者的音頻信號中的特征量在預置的語音模型中進行匹配分析,實時定位發(fā)言者的位置信息;視頻同步單元,用于根據(jù)發(fā)言者的位置信息實時調整攝像頭,從而使攝像頭采集含有發(fā)言者的視頻信號。本發(fā)明通過至少四通道對外部音場進行檢測采集,并基于語音模型對所得的音場環(huán)境中的當前發(fā)言者進行跟蹤,則得出發(fā)言者的相對位置并實時調整攝像頭進行音頻和視頻同步采集;且四個采集通道均衡設置,攝像頭轉動靈活,也通過多個通道擴大了音頻采集的范圍,從而采集立體效果的音頻質量。 |





