優(yōu)惠活動(dòng) - 12周年慶本月新客福利
優(yōu)惠活動(dòng) - 12周年慶本月新客福利
優(yōu)惠活動(dòng) - 12周年慶本月新客福利

行業(yè)動(dòng)態(tài)數(shù)據(jù)管理

        數(shù)據(jù)管理。利用網(wǎng)絡(luò)爬蟲工具從不同目標(biāo)政府網(wǎng)站中采集獲取的網(wǎng)頁是海量且無序的,還應(yīng)對(duì)其實(shí)施整理、分類、著錄、編目、鑒定等數(shù)據(jù)管理操作,實(shí)現(xiàn)信息的規(guī)則排序,使其具備增值的潛能,為后續(xù)的資源存儲(chǔ)和訪問利用奠定基礎(chǔ)。

        首先,資源分類。根據(jù)采集網(wǎng)頁資源的特點(diǎn),可以按照來源機(jī)構(gòu)、資源主題、格式類型等分類標(biāo)準(zhǔn),將其中具有某種共同屬性特征的網(wǎng)頁資源進(jìn)行歸類和整合,建立規(guī)范統(tǒng)一的政府網(wǎng)站網(wǎng)頁資源分類體系,通過不同類別的屬性特征來對(duì)海量的政府網(wǎng)頁內(nèi)容進(jìn)行區(qū)分。其次,編目著錄。對(duì)分類后的網(wǎng)頁資源還應(yīng)基于統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)對(duì)其內(nèi)容及結(jié)構(gòu)、來源、背景等特征進(jìn)行揭示和描述,并在相關(guān)元數(shù)據(jù)之間建立聯(lián)系,形成政府網(wǎng)站網(wǎng)頁資源目錄體系,實(shí)現(xiàn)對(duì)海量無序網(wǎng)頁信息的序化組織。最后,鑒定整理。政府網(wǎng)頁的鑒定整理主要包括內(nèi)容的識(shí)別以及內(nèi)容的可用性判斷,其中內(nèi)容的識(shí)別就是確保實(shí)現(xiàn)政府網(wǎng)頁長(zhǎng)期可存取的元數(shù)據(jù)、保存策略等信息要素齊全。

        內(nèi)容的可用性判斷即是通過人工干預(yù)來對(duì)政府網(wǎng)頁的形成背景、內(nèi)容質(zhì)量、重要程度等屬性特征進(jìn)行全面分析,并根據(jù)保管期限表對(duì)要?dú)w檔的政府網(wǎng)頁標(biāo)記相應(yīng)的鑒定標(biāo)識(shí)。

本文地址:http://m.hbbqcd.cn//article/22237.html
相關(guān)文章:
最新文章: