熱點推薦:
您现在的位置: 電腦知識網 >> 編程 >> SQL Server >> 正文

使用SQLserver導入和索引Microsoft Word文檔

2013-11-15 14:41:43  來源: SQL Server 

  本技巧摘自SQL Server雜志的一期如需了解更多的技巧請訪問SQL Server的使用技巧中心
  
  我需要將Microsoft Word文檔導入至SQL Server並索引這些文檔以便在關系查詢中使用這些文檔怎樣導入和索引文檔呢?
  答SQL Server允許您以多種方式導入Word文檔讓我們看看幾種最常用的方法請注意在將文檔導入至SQL Server之前您需要創建一個image數據類型列用於存放數據然後您可以使用textcopyexe命令行工具將image文件讀入數據庫從而完成文檔的導入操作如果需要該工具的基本說明文檔請在命令提示狀態下鍵入textcopy /?將Word文檔導入SQL Server的另一個方法是使用Microsoft ActiveX Directory Object(ADO)Stream接口編寫導入代碼您可以在Microsoft產品支持服務(PSS)的通過使用ADO Stream對象訪問和修改SQL Server BLOB數據一文中找到示例代碼
  
  此外您也可以將二進制數據移到SQL Server中有關這一方法的詳細說明請參閱PSS的使用ADO檢索和更新SQL Server文本域一文移動二進制數據允許您將數據的一部分存放在數據庫中這在需要控制數據格式時尤其有用例如如果只需要數據中之間的字節導入二進制數據的速度遠遠高於使用ADO Stream接口的速度這是由於SQL Server從磁盤上檢索數據的量大為減少人們通常使用這一技術來存儲位掩碼用於表示應用程序的開或關標志位
  
  SQL Server 自帶了說明了如何移動二進制數據的示例代碼如需查看該代碼只需在安裝有SQL Server 光盤上代碼示例的驅動器上選擇 \Program Files\Microsoft SQL Server\\Tools\DevTools\Samples\ado路徑展開該可執行文件在Visual Basic目錄下查找Samples子目錄在Employee示例下注意一下該代碼是如何使用FillDataFields()函數的
  
  如需索引Word文檔SQL Server 和SQL Server 都提供了全文搜索組件該組件混合使用了多種技術用以索引大型文本和image列在執行全文搜索時您需要指定image列所含的文件類型以及從二進制數據中析取信息所需的篩選(filter)有關使用全文索引的詳細信息請參閱SQL Server在線書籍中的相關主題並閱讀David Jones 月發表在SQL Server雜志網站上的名為構建更好的搜索引擎一文請注意索引Word文檔並不會自動生成包含文檔中關鍵字的一組關系表但是索引文件讓您將這些Word文檔包含在您的搜索中以下是從數據中析取關鍵字的可行方式
  
  使用OLE自動處理從文檔中讀取用戶定義的關鍵字在裝載該文檔時將這些關鍵字保存在關系表中
  使用OLE自動處理打開文檔並將其保存為文本(txt)格式為了析取重要的詞語您可以使用自己的詞語分析器遍歷該文本文件文字分析器查看文檔中的每個詞語去除一些無用文字並將每個唯一的詞語與其出現的次數一道存儲起來
  在新的全文索引文檔中搜索特定的關鍵字並將這些關鍵字輸入到關系表中
  SQL Server 提供了多個強大的工具和接口用於幫助用戶實現二進制Microsoft Office文檔的快速裝載搜索和檢索
  

From:http://tw.wingwit.com/Article/program/SQLServer/201311/22184.html
    推薦文章
    Copyright © 2005-2013 電腦知識網 Computer Knowledge   All rights reserved.