性xx色动画xx无尽,国产精品三级av三级av三级 ,中文在线√天堂,亚洲国产成人久久一区久久,亚洲熟妇色l20p

當前位置 : 首頁  圖書 正文

智能搜索引擎技術(shù)簡介,目錄書摘

2019-10-21 19:00 來源:京東 作者:京東
搜索引擎
智能搜索引擎技術(shù)
暫無報價
10評論 100%好評
編輯推薦:
內(nèi)容簡介:  《智能搜索引擎技術(shù)》以當前搜索引擎主流技術(shù)為基礎(chǔ),密切關(guān)注前沿技術(shù)發(fā)展趨勢,結(jié)合當前人工智能和自然語言技術(shù)的發(fā)展,以深入淺出的形式介紹一套完整的大數(shù)據(jù)時代背景下的智能搜索引擎的關(guān)鍵技術(shù)。
  《智能搜索引擎技術(shù)》在吸取國內(nèi)外經(jīng)典教材優(yōu)點的基礎(chǔ)上,廣泛搜集合適的實例,通過實例從多個視角對智能搜索引擎的核心技術(shù)進行全面介紹,加深讀者對關(guān)鍵概念和核心技術(shù)的理解。
  《智能搜索引擎技術(shù)》還對開源軟件進行了介紹,將技術(shù)理論與應(yīng)用范例結(jié)合。
  《智能搜索引擎技術(shù)》共分為10章,通過采用循序漸進的組織方式對搜索引擎的各個組成部分和核心技術(shù)進行了介紹。第1章引言,對搜索引擎進行了簡要概述,介紹了搜索引擎與信息檢索的關(guān)系,搜索引擎的歷史、分類及基本架構(gòu)。第2章信息采集,主要圍繞搜索系統(tǒng)的核心——網(wǎng)絡(luò)爬蟲進行介紹。第3章文本處理,對搜索引擎的文本處理功能進行了介紹,包括文本信息的提取、自然語言中的統(tǒng)計語言模型、中英文分詞技術(shù)、網(wǎng)頁去重算法等。第4章搜索引擎索引構(gòu)建,主要介紹搜索引擎的索引系統(tǒng),包括倒排索引、建立索引的方式、索引的更新策略、分布式索引及索引壓縮算法。第5章基于文本內(nèi)容的檢索模型,對搜索引擎的檢索模型進行了介紹,包括傳統(tǒng)的檢索模型,如布爾模型、向量空間模型、概率檢索模型和基于統(tǒng)計語言建模的檢索模型,以及基于機器學(xué)習(xí)的排序模型。第6章基于鏈接的檢索模型,主要對基于鏈接的檢索模型和針對鏈接作弊的反作弊模型進行了介紹。第7章查詢處理與結(jié)果展示,主要對查詢條件的糾正與過濾、查詢處理與展示的技術(shù)進行了介紹。第8章相關(guān)反饋與查詢擴展,主要對圍繞著相關(guān)反饋和查詢擴展的各項技術(shù)進行了介紹,通過采用相關(guān)反饋和查詢擴展的技術(shù)理解用戶的查詢意圖。第9章分類與聚類,主要介紹了在智能搜索引擎中用到的各種機器學(xué)習(xí)算法。第10章基于知識圖譜的搜索引擎,對未來搜索引擎的發(fā)展方向——基于知識圖譜的智能搜索引擎進行了介紹,包括知識圖譜的構(gòu)建流程、構(gòu)建中的信息抽取、知識融合、知識表示與推理等關(guān)鍵技術(shù)及其在搜索引擎中的應(yīng)用。
  《智能搜索引擎技術(shù)》適用于數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)及其計算機相關(guān)專業(yè)的本科生或研究生以及從事該領(lǐng)域研究的人員。
  通過對《智能搜索引擎技術(shù)》的閱讀,可以使讀者對智能搜索引擎的相關(guān)知識有一個基本的了解,并為將來開展研究工作打下堅實的基礎(chǔ)。
作者簡介:
目錄:第1章 引言
1.1 信息檢索與搜索引擎
1.2 搜索引擎的歷史
1.3 搜索引擎的分類
1.4 搜索引擎的基本架構(gòu)
1.4.1 主要性能需求
1.4.2 總體架構(gòu)
1.5 搜索引擎的主要組件及其功能
1.5.1 網(wǎng)絡(luò)爬蟲
1.5.2 解析器
1.5.3 索引器
1.5.4 檢索器
1.5.5 用戶交互接口
1.6 開源搜索引擎
本章小結(jié)
習(xí)題

第2章 信息采集
2.1 網(wǎng)絡(luò)爬蟲的概述
2.1.1 網(wǎng)絡(luò)爬蟲的功能特點
2.1.2 網(wǎng)絡(luò)爬蟲通用架構(gòu)
2.1.3 網(wǎng)絡(luò)爬蟲分類
2.2 分布式網(wǎng)絡(luò)爬蟲架構(gòu)
2.2.1 主從分布式結(jié)構(gòu)爬蟲(master-slave)
2.2.2 對等分布式結(jié)構(gòu)爬蟲(peer to peer)
2.3 信息采集涉及的協(xié)議
2.3.1 URL規(guī)范和HTTP協(xié)議
2.3.2 User Agent
2.3.3 Robots協(xié)議
2.4 頁面遍歷
2.4.1 寬度優(yōu)先遍歷策略
2.4.2 深度優(yōu)先遍歷策略
2.4.3 重要度優(yōu)先遍歷策略
2.5 頁面更新
2.5.1 網(wǎng)頁更新策略
2.5.2 爬蟲更新方式
2.6 深網(wǎng)抓取
2.7 開源網(wǎng)絡(luò)爬蟲
本章小結(jié)
習(xí)題

第3章 文本處理
3.1 文本信息提取
3.1.1 網(wǎng)頁數(shù)據(jù)獲取
3.1.2 非網(wǎng)頁的數(shù)據(jù)獲取
3.2 統(tǒng)計語言模型
3.2.1 N元模型(N-gram)的基本概念
3.2.2 數(shù)據(jù)平滑方法
3.3 英文分詞
3.3.1 詞素切分
3.3.2 詞干提取
3.3.3 去除停用詞3.4 中文分詞
3.4.1 中文分詞概述
3.4.2 基于詞典的機械分詞法
3.4.3 基于統(tǒng)計的分詞法
3.4.4 分詞粒度
3.5 網(wǎng)頁去重
3.5.1 通用去重算法流程
3.5.2 Shingling算法
3.5.3 SimHash算法
本章小結(jié)
習(xí)題

第4章 搜索引擎索引構(gòu)建
4.1 倒排索引
4.1.1 倒排索引基礎(chǔ)
4.1.2 詞典結(jié)構(gòu)
4.1.3 倒排表結(jié)構(gòu)
4.2 建立索引方式
4.2.1 基于內(nèi)存的索引構(gòu)建
4.2.2 基于排序的索引建立
4.2.3 基于合并法的索引構(gòu)建
4.3 索引更新
4.4 分布式索引
4.4.1 數(shù)據(jù)劃分
4.4.2 冗余和容錯
4.4.3 Elastic Search的分布式索引
4.5 索引壓縮
4.5.1 評價壓縮算法的指標
4.5.2 Delta編碼(D-Gaps)
4.5.3 無參數(shù)間距壓縮編碼
4.5.4 參數(shù)間距壓縮
4.5.5 高查詢性能的編碼
本章小結(jié)
習(xí)題

第5章 基于文本內(nèi)容的檢索模型
5.1 檢索模型概述
5.2 布爾模型
5.3 向量空間模型
5.3.1 文本表示
5.3.2 查詢相關(guān)度計算
5.4 概率檢索模型
5.4.1 概率檢索模型概述
5.4.2 二元獨立模型(binary independent model)
5.4.3 BM25模型
5.4.4 BM25F模型
5.5 基于統(tǒng)計語言建模的檢索模型
5.6 機器學(xué)習(xí)排序
5.6.1 機器學(xué)習(xí)排序概述
5.6.2 單文檔方法(pointwise approach)
5.6.3 文檔對方法(pairwise approach)
5.6.4 文檔列表方法(listwise approach)5.7 檢索質(zhì)量評價標準
5.7.1 準確率和召回率
5.7.2 前k個文檔的查準率(P@k)
5.7.3 平均查準率均值(mean average precision,MAP)
5.7.4 NDCG(normalize DCC)
本章小結(jié)
習(xí)題

第6章 基于鏈接的檢索模型
6.1 Web圖
6.2 Page Rank算法
6.2.1 基于簡單模型的Page Rank算法
6.2.2 基于隨機沖浪模型的Page Rank算法
6.2.3 主題敏感的Page Rank
6.3 HITS算法
6.3.1 HITS算法基本思想
6.3.2 HITS算法流程
6.3.3 HITS的優(yōu)勢與缺陷
6.4 SALAS算法
6.5 通用鏈接反作弊方法
6.5.1 鏈接作弊方法
6.5.2 反鏈接作弊思路
6.5.3 經(jīng)典鏈接反作弊算法
本章小結(jié)
習(xí)題

第7章 查詢處理與結(jié)果展示
7.1 查詢糾錯
7.1.1 查詢糾錯概述
7.1.2 英文糾錯
7.2 搜索智能提示
7.3 不安全信息過濾
7.4 查詢處理
7.4.1 “一次一文檔”
7.4.2 “一次一詞”
7.5 結(jié)果展示
7.5.1 頁面摘要
7.5.2 查詢結(jié)果聚類
7.6 查詢緩存機制
本章小結(jié)
習(xí)題

第8章 相關(guān)反饋與查詢擴展
8.1 相關(guān)反饋框架
8.2 顯式相關(guān)反饋
8.2.1 Rocchio相關(guān)反饋算法
8.2.2 概率相關(guān)反饋
8.2.3 相關(guān)反饋策略的評價
8.3 偽相關(guān)反饋
8.4 隱式反饋
8.5 查詢擴展
本章小結(jié)
習(xí)題

第9章 分類與聚類
9.1 文本分類
9.1.1 文本分類框架
9.1.2 貝葉斯文檔分類
9.1.3 支持向量機
9.1.4 特征選擇
9.1.5 評價
9.2 聚類
9.2.1 劃分聚類
9.2.2 層次聚類
9.2.3 評價
本章小結(jié)
習(xí)題

第10章 基于知識圖譜的搜索引擎
10.1 概述
10.2 知識圖譜的數(shù)據(jù)獲取
10.3 信息抽取
10.3.1 實體抽取
10.3.2 關(guān)系抽取
10.3.3 屬性抽取
10.4 知識融合
10.4.1 實體對齊
10.4.2 實體歧義分析
10.5 知識表示與知識推理
10.5.1 知識表示
10.5.2 知識推理
10.6 基于知識圖譜的智能搜索引擎
10.6.1 基于知識圖譜的搜索結(jié)構(gòu)
10.6.2 查詢理解
10.6.3 自動問答
本章小結(jié)
習(xí)題

參考文獻
熱門推薦文章
相關(guān)優(yōu)評榜
品類齊全,輕松購物 多倉直發(fā),極速配送 正品行貨,精致服務(wù) 天天低價,暢選無憂
購物指南
購物流程
會員介紹
生活旅行/團購
常見問題
大家電
聯(lián)系客服
配送方式
上門自提
211限時達
配送服務(wù)查詢
配送費收取標準
海外配送
支付方式
貨到付款
在線支付
分期付款
郵局匯款
公司轉(zhuǎn)賬
售后服務(wù)
售后政策
價格保護
退款說明
返修/退換貨
取消訂單
特色服務(wù)
奪寶島
DIY裝機
延保服務(wù)
京東E卡
京東通信
京東JD+