一種時間相關(guān)移動群智感知系統(tǒng)中的激勵方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及移動群智感知中一種時間相關(guān)移動群智感知系統(tǒng)中的激勵方法,屬于 無線傳感器網(wǎng)絡(luò)和移動互聯(lián)網(wǎng)的交叉領(lǐng)域。
【背景技術(shù)】
[0002] 隨著移動互聯(lián)網(wǎng)、嵌入式傳感器等技術(shù)的發(fā)展,智能手機(jī)已經(jīng)十分普及。利用普遍 存在的智能手機(jī)用戶感知和收集大規(guī)模的數(shù)據(jù)是一種新型的感知方式。移動群智感知由于 其廣泛的時空覆蓋、低廉的成本、優(yōu)秀的可擴(kuò)展性以及普遍存在的應(yīng)用場景而被認(rèn)為是一 種具有巨大潛力的新型數(shù)據(jù)感知和收集模式。目前已有一些項(xiàng)目基于移動群智感知實(shí)現(xiàn)了 健康護(hù)理、智能交通、社交網(wǎng)絡(luò)、環(huán)境監(jiān)控等領(lǐng)域中的不同應(yīng)用。
[0003] 但目前的這些應(yīng)用都是假設(shè)參與者能自愿地積極的參加數(shù)據(jù)感知,這往往不切實(shí) 際。因?yàn)閰⑴c者需要消耗設(shè)備的能量、計(jì)算能力、存儲空間、數(shù)據(jù)流量等完成群智感知任務(wù), 參與者需要得到一定數(shù)量的激勵以抵消這些損失。群智感知應(yīng)用的成功實(shí)施取決于參與者 數(shù)量以及數(shù)據(jù)質(zhì)量,沒有激勵上述兩點(diǎn)都得不到保證。因此,激勵機(jī)制的設(shè)計(jì)在群智感知應(yīng) 用中十分重要。
[0004] 然而,激勵機(jī)制的設(shè)計(jì)并不容易,因?yàn)閱蝹€參與者往往會采取策略行為,以最大化 自身的效用,這將對選擇參與者已經(jīng)決定支付數(shù)額產(chǎn)生破壞。目前,群智感知的激勵機(jī)制主 要考慮地點(diǎn)相關(guān)型的任務(wù),即任務(wù)分散在不同的地理位置。但卻忽略了時間相關(guān)型的任務(wù), 更沒有發(fā)現(xiàn)存在針對該類任務(wù)類型的激勵方法。本發(fā)明提供一種時間相關(guān)移動群智感知系 統(tǒng)中的激勵方法。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是提供移動群智感知中一種用于時間相關(guān)任務(wù)的激勵方法,解決在 時間相關(guān)類型的群智感知中選擇用戶和計(jì)算支付數(shù)額的問題。本發(fā)明相對于目前的激勵方 法,首次解決了多個時間窗口任務(wù)這種新的群智感知應(yīng)用場景的激勵機(jī)制設(shè)計(jì)問題。本發(fā) 明首先提出了該應(yīng)用場景的系統(tǒng)模型,在所提的系統(tǒng)模型下最小化社會代價。接著本發(fā)明 提出了一個貪心算法用于選擇參與者,在決定每個被選擇用戶的報(bào)酬時遵守關(guān)鍵報(bào)酬的原 貝1J,從而使得本方法具有防欺騙性。本發(fā)明所述一種時間相關(guān)移動群智感知系統(tǒng)中的激勵 方法是能高效運(yùn)行的、個人理性的、防欺騙的以及與最優(yōu)方法相比既有良好的近似度。
[0006] 本發(fā)明的技術(shù)解決方案是:
[0007] 考慮一個移動群智感知系統(tǒng)包括一個平臺和一群智能手機(jī)用戶,平臺處于云端。 本發(fā)明所述一種時間相關(guān)移動群智感知系統(tǒng)中的激勵方法是針對感知給定時間窗口內(nèi)的 連續(xù)數(shù)據(jù)的場景,在這種場景下平臺需要收集一個時間窗口內(nèi)的連續(xù)數(shù)據(jù)。每個智能手機(jī) 用戶可以提交一個或多個可以完成感知任務(wù)的時間窗口。
[0008] 本發(fā)明專利所述一種時間相關(guān)移動群智感知系統(tǒng)中的激勵方法包含一個反向拍 賣流程和兩個階段:用戶選擇階段和支付決策階段。用戶選擇階段采用貪心方法解決最小 社會代價用戶選擇問題。在支付決策階段計(jì)算每個被選擇用戶的關(guān)鍵報(bào)酬。首次對多時間 窗口的移動群智感知系統(tǒng)的進(jìn)行激勵機(jī)制的設(shè)計(jì)。平臺發(fā)布一個時間窗口w= [TS,TE],其 中[和TE分別為時間窗口的開始時間和結(jié)束時間,即平臺請求從T3到TE的感知數(shù)據(jù)。
[0009] 該方法每個用戶向平臺提交一個標(biāo)書氏=(Ri,bj,該標(biāo)書是一個二元組,其中
是用戶i能完成感知任務(wù)的時間窗口集合。每個標(biāo)書都存在一個真 實(shí)代價Ci。h是用戶i完成任務(wù)Ri的報(bào)價,即用戶i希望獲得的報(bào)酬。
[0010] 該激勵方法是最小化社會代價的,即最小化入選用戶的真實(shí)代價之和,每個用戶 對只能存在一個報(bào)價,并且滿足入選用戶的時間窗口能夠覆蓋W。
[0011] 本發(fā)明所述一種時間相關(guān)移動群智感知系統(tǒng)中的激勵方法中,平臺和智能手機(jī)用 戶的交互過程體現(xiàn)為一個反向拍賣機(jī)制,步驟如下:
[0012] 步驟201 :平臺發(fā)布一個時間窗口W= [TS,TE],其中TjPTE分別為時間窗口的開 始時間和結(jié)束時間,即平臺請求從1到TE的感知數(shù)據(jù);
[0013] 步驟202 :設(shè)智能手機(jī)用戶集合為U= {1,2,...,n},每個用戶向平臺提交一個標(biāo) 書&=(Ri,bj,其中
:是用戶i能完成感知任務(wù)的時間窗口集合。 每個標(biāo)書都存在一個真實(shí)代價Ci。h是用戶i完成任務(wù)Ri的報(bào)價,即用戶i希望獲得的報(bào) 酬;
[0014] 步驟203 :用戶選擇階段。平臺選擇用戶的子集使得所選用戶的社會代價 之和最小,并且所提交的時間窗口可以覆蓋W,選擇結(jié)束后并選擇結(jié)果告知入選用戶;
[0015] 步驟204 :用戶在自己提交的時間窗口內(nèi)感知數(shù)據(jù),將數(shù)據(jù)提交平臺;
[0016] 步驟205:支付決策階段。平臺為每個入選用戶計(jì)算關(guān)鍵報(bào)酬。并通過在線形式 支付。
[0017] 在步驟203中,平臺選擇用戶的問題形式化表示為
[0018] min2iGsCj
[0020] 上述形式化問題的本質(zhì)是:尋找一個用戶的子集,使得子集中的用戶的代價之和 最小,并且被選擇用戶的時間窗口需覆蓋整個感知時間窗口。
[0021] 在步驟203中,平臺選擇用戶時,進(jìn)入用戶選擇階段,采用貪心算法解決最小社會 代價用戶選擇問題。用戶選擇階段的步驟如下:
[0022] 步驟301 :初始化時間窗口W' =W,被選擇用戶S為空;
[0023] 步驟302 :當(dāng)W'不為空,執(zhí)行步驟303-步驟305,否則執(zhí)行步驟306 ;
[0024] 步驟303 :在集合U-S中,尋找最小的有效平均代價
,其中bh為用戶h的報(bào) 價,vh(W')為有效覆蓋,
[0025] 步驟 304 :更新W' =W' -vh(W');
[0026] 步驟305 :將用戶h并入集合S中:S=SU{h};
[0027] 步驟306 :結(jié)束,返回集合S;
[0028] 經(jīng)過用戶選擇階段后,集合S就是平臺所選擇的用戶子集。
[0029] 在步驟205中支付決策階段的步驟如下:
[0030] 步驟401 :對于集合U中的每個用戶i,置支付報(bào)酬數(shù)額Pi= 0 ;
[0031] 步驟402 :檢查是否每個S中的用戶都已經(jīng)計(jì)算出報(bào)酬,如果沒有,執(zhí)行步驟 403-步驟408,否則執(zhí)行步驟409 ;
[0032] 步驟 403 :置U' =U\{i},t=(}>,《'=W;
[0033] 步驟404 :檢查是否辛<i>,如果是執(zhí)行步驟405-步驟408,否則執(zhí)行步驟402 ;
[0034] 步驟405 :在集合U-t中,尋找最小的有效平均代價_
,其中bh為用戶h的 報(bào)價,V'h(W')為有效覆蓋,
[0035] 步驟 406 :令
[0036] 步驟407 :將用戶h并入集合t中:t-tU{i};
[0037] 步驟 408:更新《'一《'-v'h(?');
[0038] 步驟409 :輸出報(bào)酬數(shù)額矢量P,結(jié)束支付決策階段。
[0039] 本發(fā)明的有益效果是:一種時間相關(guān)移動群智感知系統(tǒng)中的激勵方法,可用于移 動群智感知系統(tǒng)中時間相關(guān)任務(wù)的用戶激勵,從而形成該類應(yīng)用的市場化機(jī)制。本發(fā)明具 有以下顯著的優(yōu)點(diǎn):
[0040] 計(jì)算時間復(fù)雜度低,該方法包括用戶選擇階段和支付決策階段總的時間復(fù)雜度為 0(n3*max|R|),其中n為用戶數(shù),|R|為用戶標(biāo)書中所含的時間窗口數(shù)。是一個完全多項(xiàng)式 時間方法,具有實(shí)際應(yīng)用的價值。
[0041] 該激勵方法是個人理性的,即平臺支付給每個入選用戶的報(bào)酬數(shù)額一定大于等于 該用戶所需耗費(fèi)的真實(shí)代價,因此對于吸引大量智能手機(jī)用戶以及提高數(shù)據(jù)質(zhì)量有積極作 用;
[0042] 該激勵方法是防欺騙的,即使智能手機(jī)用戶采取某種策略提高報(bào)價,也不是使得 用戶的效益變高,因此用戶傾向于報(bào)自身的真實(shí)價格作為報(bào)價。防欺騙性對于防止市場壟 斷或者串通具有重要作用。
[0043] 該激勵方法在用戶選擇階段采用貪心算法解決最小化社會代價用戶選擇問題,其 近似度為ln|W|+l,其中W為平臺感知時間窗口的長度。
【附圖說明】
[0044] 圖1是單時間窗口移動群智感知系統(tǒng)應(yīng)用場景;
[0045] 圖2是基于單時間窗口任務(wù)的移動群智感知反向拍賣框架;
[0046] 圖3是基于單時間窗口任務(wù)的移動群智感知反向拍賣流程;
[0047] 圖4是本發(fā)明實(shí)施例中用戶選擇階段流程圖;
[0048] 圖5是本發(fā)明實(shí)施例中支付決策階段流程圖。
【具體實(shí)施方式】
[0049] 名詞說明:
[0050] 被選擇用戶:由本發(fā)明用戶選擇階段選擇出的作為移動群智感知最終參與者。
[0051]