五月天堂网_免费看影片_1024手机看毛片_亚洲综合四区_男人的天堂影院_在线亚洲自拍

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > 非結構化數據的數據質量管理

非結構化數據的數據質量管理

2018-05-02 16:16:06 | 來源:中培企業IT培訓網

7.3  非結構化數據的數據質量管理

非結構化數據由于格式和內容的多樣性,一般不會直接用于分析,即單個非結構化數據難以產生價值。只有將非結構化數據的相關元數據(或標簽)、主要內容抽取出來,并以類似結構化數據存儲后,才能發揮價值。因此,非結構化數據的質量管理主要在于提升數據可用度,一般通過對數據的清洗、映射、關聯等機制,把繁雜的大數據變成能應對的、有效的“小數據”,構建干凈、完備的數據集,從而提高數據質量。

1)通過清洗規則庫識別并標識出非結構數據的可疑或無效信息,必要時可結合數據生命周期管理策略及時清理。

2)通過與相關的數據標準進行映射,將非結構化數據的“基本屬性”轉換為商業銀行的標準信息進行存儲(如將“建行”  “建設銀行”  “中國建設銀行”等轉換成標準代碼JGOO01),并作為結構化數據存儲在系統中。

3)通過關鍵信息與商業銀行其他結構化數據進行關聯(如通過客戶姓名、手機號等辨識其是否為本行客戶),提高非結構化數據入庫質量和數據價值。

標簽: 數據質量管理
主站蜘蛛池模板: 亚洲永久无码7777KKK | 99在线在线视频观看 | 国产不卡视频一区 | 欧美久久精品一级黑人c片 免费人成xvideos在线视频 | 午夜小视频在线观看 | 一级一片在线观看 | 日韩精品一区二区三区免费视频 | 欧洲熟妇色XXXXX欧美老妇伦 | gogo免费视频 | 南海有色南海灵通 | 99国产精品99久久久久久娜娜 | 抽搐一进一出gif免费动态 | 日韩拍拍视频 | 亚洲乱码中文字幕综合234剧情 | 综合五月婷婷 | 亚洲av日韩精品久久久久久a | 99国产精品入口 | 日韩在线视频线视频免费网站 | 美女视频黄a视频全免费 | 俺来也俺去啦最新网址 | 久久久女人与动物群交毛片 | 精品一区二区三区的国产在线观看 | 日日干天天干 | 日本不卡不码视频 | 午夜免费视频网站 | 日本中文字幕在线视频 | 成人免费区一区二区三区 | 4438╳全国最大色倩网址 | 日本精品巨爆乳无码大乳巨 | 国产精品一区二区三区四区 | av大帝天堂 | 黄色三级一级片 | 女人性生交大片免费 | 天天干天天射天天插 | 麻豆精品偷拍人妻在线网址 | 黄色网址在线免费观看 | 曰韩精品视频 | 柳文文被肉干高H潮文不断 一级婬片a级中文字幕 | 亚洲av日韩av天堂久久 | a级黄视频 | 在线免费播放av |