互聯(lián)網(wǎng)信息監測與決策分析平臺.由于互聯(lián)網(wǎng)產(chǎn)生的信息泛濫,研究人員很難快速評估一個(gè)事件的真實(shí)情況。本次項目即為了解決以上問(wèn)題,為科研人員提供一個(gè)智庫平臺。

互聯(lián)網(wǎng)信息監測與決策分析平臺


由于互聯(lián)網(wǎng)產(chǎn)生的信息泛濫,研究人員很難快速評估一個(gè)事件的真實(shí)情況。本次項目即為了解決以上問(wèn)題,為科研人員提供一個(gè)智庫平臺。

項目概況

怎樣從海量的科技信息及其相關(guān)信息中掃描、識別、監測和追蹤科技主題的發(fā)展變化,怎樣高效獲取和有效組織這些信息,并從中發(fā)現科學(xué)技術(shù)的體系結構、領(lǐng)域之間的關(guān)系及其變化,是本項目的切入點(diǎn),因此,構建科技發(fā)展前沿互聯(lián)網(wǎng)信息監測與分析平臺勢在必行。

項目客戶(hù)對象:?政府管理與決策者 、科研機構 蚣茅、科研人員、智庫平臺等。

項目功能

監測與分析平臺由網(wǎng)站信息抓取、文件管理 腌俄、本體管理、信息檢索、信息分析和用戶(hù)管理6部分組成。本項目建成后昏掏,將能夠為研究人員獲取和分析研究資料提供高效的工具,并逐步形成相關(guān)研究領(lǐng)域的知識庫、資料庫。本項目建成后耍诗,在研究過(guò)程的每一個(gè)環(huán)節上,都能提供有效的優(yōu)化工具,如下所示:
(一)擴大信息獲取的覆蓋面;
(二)海量信息的自動(dòng)分類(lèi)和關(guān)鍵元素提取;
(三)更精確地定位和查閱有效信息帆沪。


在課題研究階段,本項目實(shí)現多維分析、傾向性分析、熱點(diǎn)分析寄症、趨勢分析等功能,能夠有效輔助研究人員從大量的信息和文獻中進(jìn)行分析,提煉出有助于研究工作的素材朱禁。
在形成研究成果階段,信息系統能夠根據預置模板,生成相關(guān)分析報表、分析報告和原始資料亮榴,并支持導出成為Word等格式,更便于研究人員編制研究成果。
信息獲取的方式監測與分析平臺提供了網(wǎng)站信息自動(dòng)抓取和用戶(hù)收集信息上傳這兩種信息獲取的方式。網(wǎng)站信息自動(dòng)抓取,主要抓取公開(kāi)發(fā)布于互聯(lián)網(wǎng)的信息。為使信息能最大程度的自動(dòng)化處理静暖,需要構建網(wǎng)站解析庫,保存網(wǎng)站中不同網(wǎng)頁(yè)的信息,監測與分析平臺據此批量下載所選網(wǎng)站中需要下載的內容。

信息采集源

政府和機構網(wǎng)站

主要指國際、國內主要相關(guān)政府部門(mén)和國際組織的官方網(wǎng)站,國際知名智庫苍插、大學(xué)和研究機構的網(wǎng)站,這些網(wǎng)站是有關(guān)國際問(wèn)題的權威信息發(fā)布途徑。

學(xué)術(shù)期刊網(wǎng)站

包括境內外國際問(wèn)題研究領(lǐng)域、具有較高影響力的各學(xué)術(shù)期刊網(wǎng)站,主要獲取最新研究主題和研究動(dòng)向,了解最新學(xué)術(shù)發(fā)展情況隆琢。

新聞媒體網(wǎng)站

新聞媒體網(wǎng)站主要包括國際似魄、國內主流新聞媒體網(wǎng)站,是獲取最新國際重大事件鲁丰、相關(guān)事態(tài)發(fā)展最新情況的有效途徑。
除了上述網(wǎng)站,本項目還需要進(jìn)一步采集相關(guān)領(lǐng)域專(zhuān)業(yè)數據庫,并實(shí)現和本市宣傳部門(mén)的數據共享范愁。

相關(guān)領(lǐng)域數據庫

實(shí)現各主要大國、地區大國、以聯(lián)合國為首的重要國際組織归诸、以二十國集團和金磚國家等為代表的重要多邊機制官方發(fā)布報告庫(中英法三語(yǔ)種)的信息采集抓取泳柴,整合上海外國語(yǔ)大學(xué)學(xué)術(shù)論文數據庫、中國知網(wǎng)凫海、中國統計年鑒、海關(guān)統計年鑒陵褥、中國工業(yè)經(jīng)濟統計年鑒、中國工業(yè)企業(yè)數據庫、中經(jīng)網(wǎng)統計數據庫等專(zhuān)業(yè)數據庫的部分查詢(xún)功能红苔。

省市區開(kāi)放共享數據

據初步了解,各省市區部門(mén)正在建設互聯(lián)網(wǎng)內容安全監管和文化建設共享平臺(簡(jiǎn)稱(chēng)“共享平臺”)株汉,該平臺主要采集國內有關(guān)的中文輿情信息,并可提供共享弯洗。

功能分析

  • 對文本中的關(guān)鍵統計數據進(jìn)行專(zhuān)門(mén)的提取(如國防預算、GDP增速等)
  • 對文本內容進(jìn)行自動(dòng)的概括和總結姿鸡,形成諸如自動(dòng)摘要的服務(wù)。?
  • 對文本內容的關(guān)鍵元素進(jìn)行提取,如人物卖檬、機構铃傀、地點(diǎn)、時(shí)間倡鲸、事件缚武、信源等。
  • 對數據庫的文本類(lèi)型進(jìn)行分類(lèi)簿略,如新聞報道、新聞分析和社論第岖、政府文件、期刊論文、研究報告、公報聲明黍少、領(lǐng)袖講話(huà)以及民調數據等。
  • 對文本的傾向性態(tài)度進(jìn)行初步分析,從而幫助研究人員撰寫(xiě)定期或不定期的國際輿情報告秽荞。
  • 對文本中的事件、人物窥血、機構并巍、地點(diǎn)等要素進(jìn)行熱點(diǎn)和趨勢分析。

海量非結構化文本信息經(jīng)過(guò)處理后,形成了結構化或半結構化的數據宠璧,需要進(jìn)行多維度的分析工作设了。系統應能夠提供各類(lèi)基礎分析模型和自定義分析工具,主要分析模型包括:

  • 時(shí)間檢索多維分析模型
  • 地點(diǎn)檢索多維分析模型
  • 人物檢索多維分析模型
  • 機構檢索多維分析模型
  • 事件檢索多維分析模型
  • 書(shū)籍檢索多維分析模型
  • 論文檢索多維分析模型

總結

監測與分析平臺通過(guò)高效獲取不同來(lái)源、不同格式的信息笼动,運用本體技術(shù)對這些信息進(jìn)行有效的組織,展現這些信息反映的科技領(lǐng)域知識概念的結構及其變化,同時(shí)運用文本聚類(lèi)技術(shù)增热,深入挖掘科技主題及其相互關(guān)系焙馅,結合國家、時(shí)間等維度的變化尖洞,為分析科技發(fā)展的宏觀(guān)走勢噪踏,以及對科技汛焚、經(jīng)濟和社會(huì )產(chǎn)生影響的科技發(fā)展前沿趨勢提供支撐。

?

相關(guān)閱讀:更多案例!

最全的中國開(kāi)放數據(Open Data)及政府數據開(kāi)放平臺匯總

【Open Data】國外開(kāi)放數據中心及政府數據開(kāi)放平臺匯總

全國大數據交易所及數據交易平臺匯總

蜀ICP備15035023號-4