1、科技項目申報
3、專利代理
5、可研報告編制
9、國家火炬計劃
按照國家科學技術(shù)獎勵工作辦公室要求,現(xiàn)對安徽省2019年度提名國家科技獎勵的7個項目進行公示。
公示時間為2019年1月14日至2019年1月20日,為期7天。
公示期內(nèi),任何單位或者個人如對公示項目的真實性和內(nèi)容有異議,可以書面方式提出并提供必要的證明文件及聯(lián)系方式。個人提出異議的應表明真實身份,單位提出的應加蓋公章。匿名異議和超出期限的異議不予受理。
(一)項目名稱
大數(shù)據(jù)挖掘的若干模型和方法
(二)提名意見
該項目對大數(shù)據(jù)挖掘的若干模型和方法開展了深入研究,解決了大數(shù)據(jù)挖掘若干科學問題,例如,系統(tǒng)性地闡明大數(shù)據(jù)的基本特征,提出了大數(shù)據(jù)多層次處理框架;設計稀疏嵌入與最小方差下的哈希方法,有效解決訓練數(shù)據(jù)集具有海量特征和高維特征的問題;發(fā)明了含缺失值的決策樹分類子,可以直接有效地利用缺失數(shù)據(jù)。
研究成果發(fā)表在TKDE、TIP和PAMI等權(quán)威雜志,在國內(nèi)外產(chǎn)生一定的學術(shù)影響,被同行引用2600多次、SCI引用1100多次,獲得了學術(shù)界和工業(yè)界的跟進發(fā)展和采用,推動了本學科及相關(guān)學科的發(fā)展。
項目材料填寫規(guī)范,內(nèi)容真實,經(jīng)公示無異議。對照國家自然科學獎授獎條件,提名該項目為國家自然科學獎二等獎。
(三)項目簡介
圖靈獎獲得者斯通布雷克教授認為,大數(shù)據(jù)的四種含義之一是大多樣性,意指:處理來自太多源的數(shù)據(jù)必然導致令人畏懼的數(shù)據(jù)集成挑戰(zhàn)。數(shù)據(jù)集成的實質(zhì)性困難在于多源數(shù)據(jù)的海量、異質(zhì)異構(gòu)和低質(zhì)量性,這也一直是數(shù)據(jù)庫領域的基礎性關(guān)鍵研究問題。該項目組在過十來年對大數(shù)據(jù)的上述挑戰(zhàn)中海量、高維、動態(tài)和低質(zhì)量等問題展開深入研究,揭示了大數(shù)據(jù)中模式的形態(tài)與演變態(tài)勢,提出訓練樣本的分塊挖掘方法、噪音數(shù)據(jù)和缺失數(shù)據(jù)利用模型,從而,在2013年闡明了大數(shù)據(jù)的四個基本特征:異構(gòu)、自治、復雜和演化,凝練出HACE定理。主要科學發(fā)現(xiàn)點如下:
1、大數(shù)據(jù)的基本特征與挖掘框架:闡明大數(shù)據(jù)的基本特征,提出了大數(shù)據(jù)多層處理框架,為大數(shù)據(jù)分析提供了理論基礎和應用框架;提出稀疏嵌入與最小方差下的哈希方法,用于處理海量特征和高維特征的訓練數(shù)據(jù)集。
2、不完全動態(tài)大數(shù)據(jù)的模式發(fā)現(xiàn):揭示大數(shù)據(jù)中模式的形態(tài)與演變態(tài)勢,提出面向大數(shù)據(jù)的不完全信息下模式發(fā)現(xiàn)、動態(tài)模式發(fā)現(xiàn)和模式演變的模型與方法。
3、噪音以及缺失數(shù)據(jù)的模式質(zhì)量:揭示噪音數(shù)據(jù)的可修正機制及缺失數(shù)據(jù)與已知數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,提出誤差感知下的貝葉斯分類器用于解決噪聲數(shù)據(jù)清洗所帶來的信息丟失和信息錯誤的問題。
臥濤首頁 | 關(guān)于臥濤 | 高企認定 | 專利代理 | 科技項目申報 | 成果轉(zhuǎn)化 | 通知公告 | 行業(yè)資訊 | 解疑答惑 | 聯(lián)系臥濤 |