您好 [请登录]   [免费注册]
gb
音频信息检索理论与技术
 
   
查看大图

音频信息检索理论与技术

本书系统地介绍音频信息检索研究的相关理论、技术与方法,以及该学科领域的最新进展。内容包括音频信息检索的基本理论、表示级和语义级的音频信息检索技术等。在表示级的检索中,重点介绍基于直接特征匹配的音频样例检索方法,内容涉及基于分段的实时检索、基于索引的检索,以及基于硬件实现的快速检索。在语义级的检索中,分别介绍语音文档检索、说话人检索、音乐检索等内容。针对语音文档检索,介绍直接利用语音识别最优候选结果的?索、基于音节网格搜索的检索、基于音节倒排索引的检索、基于后验概率邻接音节矩阵的检索,以及语音文档检索中的容

  • 商品编号:SJ1843
  • 商品重量:600.000 克(g)
  • 货  号:SJ1843
  • 计量单位:
  • 所得积分:46
  • 作者: 韩纪庆,郑铁然,郑贵滨 著
  • 出版社: 科学出版社
  • ISBN: 9787030303721
  • 出版时间: 2011-3-1
  • 版次: 第1版
  • 字数: 307000
  • 页数: 244
  • 开本: 10开
  • 纸张: 胶版纸
  • 包装: 平装
  • 市场价: ¥48.00
  • 销售价: ¥46.00
  • 节省: ¥2.00
  • 已经有123位朋友关注此商品,最近一个月已售出0件。
购买数量:
  (库存100)
app hook

【基本信息】:

作者:韩纪庆,郑铁然,郑贵滨 著

出版社:科学出版社

出版日期:2011-3-1

ISBN:9787030303721

版次:1

页数:244

字数:307000

开本:16开

用纸:胶版纸

包装:平装


【内容简介】:

  本书系统地介绍音频信息检索研究的相关理论、技术与方法,以及该学科领域的最新进展。内容包括音频信息检索的基本理论、表示级和语义级的音频信息检索技术等。在表示级的检索中,重点介绍基于直接特征匹配的音频样例检索方法,内容涉及基于分段的实时检索、基于索引的检索,以及基于硬件实现的快速检索。在语义级的检索中,分别介绍语音文档检索、说话人检索、音乐检索等内容。针对语音文档检索,介绍直接利用语音识别最优候选结果的?索、基于音节网格搜索的检索、基于音节倒排索引的检索、基于后验概率邻接音节矩阵的检索,以及语音文档检索中的容错技术。针对说话人检索,介绍直接利用说话人识别进行检索的方法,以及基于说话人索引的间接检索方法。针对音乐检索,介绍音乐语义信息获取方法——音乐自动标注,以及哼唱检索、拍打检索、基于节拍谱的检索等方法。

  本书可作为高等院校计算机应用、信号与信息处理、通信与电子系统等专业及学科的研究生教材,也可供该领域的科研及工程技术人员参考。

【目录】:

前言

第一部分 音频信息检索的发展与理论基础

 第1章 绪论

  1.1信息检索技术的分类及进展

  1.1.1概述

  1.1.2文本信息检索

  1.1.3多媒体信息检索

  1.2音频信息检索技术的发展

  1.2.1语音文档检索

  1.2.2说话人检索

  1.2.3音乐检索

  1.3音频信息检索的应用

  1.4本书的构成

  参考文献

 第2章 音频信息检索的基础

  2.1人类对音频信息的认知机理

  2.1.1听觉的生理基础

  2.1.2听觉的感知机制

  2.1.3听觉特性

  .2.2音频信号?数字处理及特征表示

  2.2.1信号的统计特征

  2.2.2感知特征

  2.3音频信息检索框架及模型

  2.4音频信息检索的评价

  参考文献

第二部分 表示级的音频检索

 第3章 基于直接匹配的音频样例检索方法

  3.1基于分段的实时检索方法

  3.1.1片段划分

  3.1.2基于检索窗的检索控制

  3.1.3基于分段的检索方法

  3.1.4快速分段检索方法

  3.2mpeg—1压缩域模糊分类的检索方法

  3.2.1mpeg音频编码简介

  3.2.2mpeg—1压?域特征选择和提取

  3.2.3基于h怦eg—1压缩域模糊分类的检索方法

  参考文献

 第4章 基于索引的音频样例检索方法

  4.1局部敏感哈希索引方法

  4.1.1局部敏感哈希

  4.1.2少稳定分布局部敏感哈希

  4.1.3少稳定分布局部敏感哈希音频索引方法

  4.2基于局部敏感哈希倒排索引的检索方法

  4.2.1基于局部敏感哈希的倒排索引构造

  4.2.2基于局部敏感哈希倒排索引的搜索

  4.3基于树与链表混合索引的检索方法

  4.3.1模糊直方图模型

 ?4.3.2树与链表混合索引构造

  4.3.3基于树与链表混合索引的搜索

  4.3.4时间复杂度分析

  参考文献

 第5章 基于cpu通用计算的快速音频样例检索方法

  5.1通用图形处理器与统一计算设备框架

  5.1.1通用图形处理器

  5.1.2统一计算设备框架

  5.2检索算法gpu加速的可行性分析

  5.2.1检索算法可移植性分析

  5.2.2检索算法计算特点分析

  5.3检索算法gpu加速的实现

  5.3.1以线程为粒度的算法实现

  5.3.2以线程块为粒度的算法实现

  5.3.3加速效果比较

  参考文献

第三部分 语义级语音文档检索

 第6章 语音文档检索的预处理技术

  6.1语音文档检索系统的组成

  6.2检索系统中的预处理技术

  6.2.1连续语音识别

  6.2.2关键词检出

  6.3语音文档检索的评价指标

  参考文献

 第7章 语音文档检索的索引和搜索技术

  7.1基于关键词检出的检索方法

  7.2基于语音识别器最优候选的检索方法

  7.2.1基于大词表连续语音识别器最优候选的检索方法

  7.2.2基于子词识别器最优候选的检索方法

  7.3基于音节网格搜索的检索方法

  7.3.1音节网格的若干定义及性质

  7.3.2基于音节网格搜索的检索方法

  7.3.3索引去冗余方法

  7.3.4检索性能分析

  7.4基于音节倒排索引的检索方法

  7.4.1倒排索引结构

  7.4.2采用时间匹配机制的检索方法

  7.4.3采用位置匹配机制的检索方法

  7.4.4检索性能分析

  7.5基于后验概率邻接音节矩阵的检索方法

  7.5.1语音文档的表示

  7.5.2网格的邻接音节后?概率矩阵

  7.5.3语音文档的邻接音节后验概率矩阵

  7.5.4检索方法描述

  7.5.5基于韵律加权的索引修正

  7.5.6检索性能分析

  参考文献

 第8章 语音文档检索中的容错技术

  8.1基于模糊匹配策略的容错方法

  8.2基于融合策略的容错方法

  8.2.1索引层面的融合

  8.2.2分数层面的融合

  8.3基于扩充网格的容错方法

  8.3.1算法的基本思想

  8.3.2基于局部路径的简化计算

  8.3.3基于扩充网格的检索精度提高方法

 ?8.3.4检索性能分析

  8.4基于词片语言模型的容错方法

  8.4.1词片

  8.4.2基于互信息的词片选择算法

  8.4.3基于词片的语言模型

  8.4.4采用词片识别器的检索方法

  参考文献

第四部分 语义级的说话人检索

 第9章 说话人检索

  9.1说话人分割

  9.2检索中的说话人识别技术

  9.2.1基于gmm的识别方法

  9.2.2基于gmm—ubm的识别方法

  9.3直接利用说话人识别实现的检索技术

  9.3.1极低错误接受率的实现

  9.3.2训?语料不充分问题的解决

  9.4间接利用说话人识别实现的检索技术

  9.4.1锚模型索引方法

  9.4.2gmm模型索引方法

  参考文献

第五部分 语义级的音乐检

 第10章 音乐自动标注

  10.1音乐声学基础

  10.1.1乐音的感知

  10.1.2音程、音律、音名与音高标准

  10.1.3音乐的要素

  10.2音乐自动标注方法及存在的问题

  10.3基于谐波结构信息的音乐标注

  10.3.1基于bp神经网络的起始点检测

  10.3.2基于谐波结构信息的多基频估计?法

  10.4基于半音域频率系数的歌曲旋律提取

  10.4.1半音域频率系数

  10.4.2基于viterbi方法的旋律提取

  参考文献

 第11章 音乐检索

  11.1哼唱检索

  11.1.1基于规则的哼唱旋律提取

  11.1.2乐曲库的索引方法

  11.1.3旋律匹配

  11.2拍打检索

  11.2.1特征提取

  11.2.2基于drw的匹配计算

  11.3基于色度图的复调音乐检索

  11.3.1色度

  11.3.2色度图

  11.3.3离散色度图和色度特征

  11.3.4基于色度的相关计算与检索

参考文献


【书摘】:

   信息检索(information retrieval)技术的历史最早可以追溯到图书资料的手工检索时期,主要应用于图书馆等场所,从大量的图书资料中找到用户所需要的书目。随着现代技术的发展,一方面人类积累的图书、资料、文件越来越多,且多以电子化的形态存在,采用传统的手工查找方法难以满足实际要求,如何有效管理和高效查找相应的内容变得越来越迫切;另一方面计算机技术在信息处理领域的快速发展,也为高效地实现自动信息检索提供了可能,由此产生了现代信息检索技术。

现代信息检索是指针对用户的检索需求,利用一定的检索算法,从结构化或非结构化的数据中获取相关有用信息的过程。这一概念的提出最早可以追溯到1945年Bush的论文。在该文中,作者第一次提出了设计自动的、能在大规模存储数据中进行查找的机器的构想。这篇论著被认为是现代信息检索技术的开山之作。

现实世界中存在着大量的数据文件,它们保存了历史上多种多样的信息。这些文件既有文本类型的,如各种报刊、图书资料和科技文献等,也有音、视频多媒体类型的,如影视节目、音乐、图片等。由于面对的数据对象的类型不同,其所要查找的内容及所采用的方法也有所不同,因此通常可以将信息检索技术分为文本信息检索和多媒体信息检索两大类。

从20世纪40年代信息检索概念的提出,到50年代文本信息检索的逐步兴起,再到90年代蓬勃发展起来的多媒体信息检索技术,时至今日信息检索这一研究方向经历了巨大的变化,从早期基于文本的信息检索发展到当前基于内容的多媒体信息检索,检索源的数据类型越来越复杂,检索策略和技术手段也越来越丰富。下面我们将分别介绍文本信息检索与多媒体信息检索各自的相关概念,以及它们主要的进展情况。


【插图】:




如果您对本商品有什么问题,请提问咨询!
如果您对本商品有什么评价或经验,欢迎分享!

支付方式

正品保证

热销商品推荐

浏览过的商品

Copyright © 2002-2023 电脑音乐书店 版权所有  All Rights Reserved  中国·天津·东丽区   津ICP备05008346号
本商店顾客个人信息将不会被泄漏给其他任何机构和个人    本商店logo和图片都已经申请保护,不经授权不得使用
有任何购物问题请联系我们在线客服  |  电话(TEL):13312093288  E-mail:service#midibooks.net (请将#用@替换)

Powered by ShopEx v4.9.0 |Gzip enabled 津ICP备05008346号
站长统计