關于格微
關于格微
  當前位置:首頁/ 解決方案 /

情報采集更新

  
情報信息跟蹤采集工具
 

格微情報信息采集工具基于知識管理思想和相關技術架構搭建,采用知識挖掘技術作為核心支撐,結合企業研究所的情報管理和應用需求現狀及特點,基于互聯網上國內外同行業公開的網站實現信息的輔助跟蹤、采集和管理等功能。它整合企業情報渠道,改進了信息收集效率,提高了對重要信息采集處理的及時性和有效性,實現了對互聯網多種格式化信息源的采集、分類和存儲,建立共享性好、統一管理的情報輔助處理工具。 
    根據情報采集的目標和形式不同,分為“主題跟蹤”和“定點跟蹤”兩種形式。具體應用形式如下:

 
一、主題跟蹤采集工具
    利用主題跟蹤采集工具可以定制檢索引擎,通過對情報采集的相關主題內容和檢索條件的設置實現對相關范圍的網站提供的與跟蹤主題相關的內容進行自動搜索和下載。工具輔助情報人員完成一站式搜索和管理,并對檢索結果做歸納和整理,輔助情報人員對檢索結果做快速篩選和處理。

序號

模塊

功能項

主要功能及特色

1

主題管理

主題目錄管理

以樹形結構管理主題分類,包括:新建主題、重命名、刪除。

2

主題設置管理

對具體的某項采集主題內容進行管理,包括:設置跟蹤條件、啟動跟蹤、重命名,刪除等。

3

搜索管理

搜索條件管理

根據不同搜索引擎的檢索形式和條件進行搜索條件配置管理。

4

搜索結果管理

根據設置的搜索條件,搜索引擎自動跟蹤網站產生預搜索結果的摘要和標題信息,形成搜索結果列表。可以對搜索結果列表進行下載、刪除等管理。結果列表信息中包括條目的權值、狀態、標題、文件類型、更新時間、網頁類型等。

5

文件預覽

對搜索結果列表中的內容可以進行原網頁或文檔信息預覽。便于用戶確定網頁內容是否符合下載的需要。可以實現對網頁、word、pdf、ppt等多種格式文檔的下載和預覽功能。

6

收藏管理

收藏夾管理

按照搜索主題創建最終結果的收藏目錄。每個最底層目錄下可以保存搜索結果的文件。
可以對收藏夾進行維護,包括:打開、新建、清空、導出結果、重命名、刪除功能。

7

歷史記錄

可以按照主題查看已導出的歷史結果。

8

工具設置

文件下載設置

可以對工具下載的線程數、超時時間、下載文檔臨時目錄、網頁自動跟蹤檢查、網頁預覽、網頁內容去噪、臨時文件清空等功能信息配置管理。

9

代理設置

某些網站需要使用代理方式才能正常訪問,系統提供常用代理站點的維護管理功能,包括不使用代理、使用指定代理以及采用輪詢機制訪問代理等。

10

其他設置

包括文檔結果收藏夾路徑設置、搜索跟蹤的最大結果數量設置、搜索結果狀態顯示以及搜索結果自動過濾設置等。

表- 功能模塊列表
·主題管理:以樹形結構管理主題分類,對具體的某項采集主題內容進行管理,包括設置跟蹤條件、啟動跟蹤、重命名,刪除等。

圖- 搜索主題設置

·搜索管理:根據不同搜索引擎的檢索形式和條件進行搜索條件配置管理。根據設置的搜索條件,搜索引擎自動跟蹤網站產生預搜索結果的摘要和標題信息,形成搜索結果列表。可以對搜索結果列表進行下載、刪除等管理。結果列表信息中包括條目的權值、狀態、標題、文件類型、更新時間、網頁類型等。對搜索結果列表中的內容可以進行原網頁或文檔信息預覽。便于用戶確定網頁內容是否符合下載的需要。可以實現對網頁、word、pdf、ppt等多種格式文檔的下載和預覽功能。
·收藏管理:按照搜索主題創建最終結果的收藏目錄。每個子節點目錄下可以保存搜索結果的文件。可以對收藏夾進行維護,包括:打開、新建、清空、導出結果、重命名、刪除功能。
·工具設置:可以對工具下載的線程數、超時時間、下載文檔臨時目錄、網頁自動跟蹤檢查、網頁預覽、網頁內容去噪、臨時文件清空等功能信息配置管理。某些網站需要使用代理方式才能正常訪問,系統提供常用代理站點的維護管理功能,包括不使用代理、使用指定代理以及采用輪詢機制訪問代理等。
工具針對美國專利搜索網站的特點做了針對性的分析處理,采用圖文結合的方式展示專利內容,工具可以實現自動下載并生成統一的瀏覽文檔,大大簡化了傳統的手工逐個頁面下載的操作復雜度。
 
二、定點跟蹤采集工具
    定點跟蹤采集工具可以實現對指定網站和欄目內容的網頁進行定期的自動采集和整理,適用于對定期更新和變化的新聞類或技術論壇類網站的跟蹤采集。工具提供采集站點管理、采集結果管理、采集結果優化設置等,詳細內容如下表所示:

序號

模塊

功能項

主要功能及特色

1

站點管理

站點訂閱設置

以樹形結構管理新聞站點分類,包括:新建站點、重命名、刪除等。

2

采集規則設置

對具體的某項采集站點進行管理,根據站點頁面鏈接的特點,設置自動下載的規則,包括:常規設置、采集頁面規則、翻頁規則和系統登陸設置等。

3

跟蹤周期設置

針對某一具體采集站點內容更新的規律,可以設置網頁內容自動跟蹤下載的周期,如:按照每日、每周、每月等。

4

結果管理

采集結果管理

系統提供交互式的站點結果管理列表,便于對采集內容進行管理和維護以及導出應用等。結果列表內容包括:內容標題、下載狀態、存儲文件名稱、采集時間等。
采集結果分成:當前采集資源、未導出資源、已導出資源和已刪除資源。

5

結果內容預覽

可以選取某項采集內容進行在線預覽。

6

結果優化

結果頁面內容選取規則

工具提供交互式的操作方式實現對同類網頁中的下載內容進行選取分析,過濾掉頁面上與正文內容不相關的廣告、其他鏈接等信息。可以通過模板方式設置,然后工具自動實現對同類網頁的噪音去除功能。

·站點管理:以樹形結構管理新聞站點分類,包括:新建站點、重命名、刪除等。對具體的某項采集站點進行管理,根據站點頁面鏈接的特點,設置自動下載的規則,包括常規設置、采集頁面規則、翻頁規則和系統登陸設置等。針對某一具體采集站點內容更新的規律,可以設置網頁內容自動跟蹤下載的周期,如按照每日、每周、每月等。對下載完成的結果可以定期導出,提供給企業相關部門用戶使用。

圖- 采集站點管理

·采集結果優化:工具提供交互式的操作方式實現對同類網頁中的下載內容進行選取分析,過濾掉頁面上與正文內容不相關的廣告、其他鏈接等信息。可以通過模板方式設置,然后工具自動實現對同類網頁的噪音去除功能。


沈陽格微軟件有限責任公司
電  話:024-86800538    024-86807029   
聯系人:廉  鵬   
地址:沈陽道義經濟開發區道義南大街37號700信箱 郵編:110136
網  站:www.ppmcll.live
郵  件:[email protected]


正规时时彩官网下载 安徽快3时时彩 重庆时时龙虎3期计划免费 广东时时彩推荐 11选5北京走势图中奖条件 河北快3开奖结果l 排列三045前后的关系 波克城市官方 江苏快三大小投注技巧 重庆时时现场开奖结果 北京快乐8软件 湖南幸运赛车规则 推荐宝妈赚钱 ag刺激战场战队 山西十一选五开奖官网 甘肃十一选五玩法规则