俄羅斯國家研究型大學(xué)莫斯科鋼鐵冶金學(xué)院開發(fā)出一種數(shù)學(xué)模型,有助于預(yù)測(cè)社交媒體用戶下的度假地。研究人員認(rèn)為,這有助于旅行社以及所有與旅游業(yè)相關(guān)的機(jī)構(gòu)預(yù)測(cè)人們?cè)谛菁倨陂g的度假地需求。研究結(jié)果發(fā)表在《環(huán)境智能和人工計(jì)算雜志》上。
人們每天在社交媒體上分享照片、鏈接、評(píng)論和位置,研究人員對(duì)開放來源的推特?cái)?shù)據(jù)進(jìn)行了分析。在機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析方法的基礎(chǔ)上,可以預(yù)測(cè)用戶的下個(gè)目的地。
研究人員之一、該學(xué)院信息商務(wù)系統(tǒng)研究所所長(zhǎng)馬林娜·涅朱林娜介紹說:“我們不僅使用了開放的旅游數(shù)據(jù),還使用了游客本身的個(gè)性數(shù)據(jù)。首先我們從數(shù)據(jù)中提取出所有關(guān)于位置信息的推文。在隨機(jī)抽取的5000名歐洲諸國(法國、德國、瑞典、西班牙、意大利、瑞士、波蘭、希臘和許多其他國家)推特用戶的個(gè)人主頁中,出現(xiàn)了大約80多萬條推文。在選擇數(shù)據(jù)時(shí),訪問量最高的旅行種類是‘美食’‘夜總會(huì)’‘火車站’‘教堂’‘海灘’。我們?yōu)槊總€(gè)種類準(zhǔn)備了單獨(dú)的數(shù)據(jù)選擇。”
涅朱林娜稱,在選擇種類數(shù)據(jù)時(shí),還與用戶的性格進(jìn)行了比對(duì),因?yàn)橛脩舭l(fā)推文時(shí)的選詞主要取決于他們的個(gè)人價(jià)值觀。
研究人員認(rèn)為,通過收集社交媒體用戶的國籍、性別、用戶等參數(shù),可以獲得更詳細(xì)的預(yù)測(cè)。下一階段是借助機(jī)器學(xué)習(xí)方法系統(tǒng),分析和構(gòu)建模型。
關(guān)鍵詞: 新數(shù)字模型 預(yù)測(cè)游客度假