題目要求
找出一個頁面中出現次數最多的標簽?。?!
個人解法:
var eles = document.getElementsByTagName('*');
var rs = [];
for(var i=0; i<eles.length; i++) {
var tag_name = eles[i].tagName.toLowerCase();
if(undefined != tag_name) {
if(inJsonArray(rs, tag_name)) {
addWeight(rs, tag_name);
}else {
rs.push({
tag : tag_name,
weight : 1
})
}
}
}
SortByWeight(rs);
思路:
拿到所有的標簽--根據標簽名稱聚類---根據權重排序。
如果有更好的方法,歡迎交流。
下面看今天這個問題:
獲取一張圖片的top N主色值,和上面最多標簽的問題很類似,數據大小有區別,別的都差不多的。
這個問題思路很清晰,第一步,拿到圖片的數據;第二步,根據色值進行聚類;第三步,對聚類結果排序。所以這次就是根據這個思路去實現。
1、數據獲取
圖片數據獲取使用了canvas的getImageData()方法,能獲取到圖片每個像素點的rgba數據。
var imgdatas=context.getImageData(0,0,150,150);//獲取當前canvas數據
var imgdata = imgdatas.data;//獲取rgba數據
var i = 0, len = imgdata.length;
var arr = [];
//將圖片rgba數據push到新數組中
for(i ; i<len ; i+=4 ) {
arr.push(imgdata[i]+','+imgdata[i+1]+','+imgdata[i+2]+','+imgdata[i+3]);
}
這樣就可以拿到圖片的所有數據了,剩下的就是數學問題了。
2、數據聚類
去重,相同色值合并,記錄該色值出現個數(權重)weight
聚類方法就比較多了,直接數學統計,或者k-means,決策樹,樸素貝葉斯,支持向量機等等,喜歡哪個就用哪個就可以了,但是還是需要考慮下不同方法的適用情況和效率什么的了。
我們會得到這樣一個數組 [{rgba: '21,12,45,0', weight: 12}, {...}]來記錄色值和出現次數,
3、聚類結果排序
對上一步中得到的json數組進行排序,根據屬性weight的值從大到小或者從小到大排序,排序算法就不用多言了。
4、結果預覽

5、to Do
相似色值合并
rgba(234,234,234,1)和rgba(234,235,235,1)類似的這種是否有必要合并成為一個值,這里又會涉及到相似度計算等問題。
優化聚類算法
提高復雜度,提升性能,提升執行速度
結合可視化的一些東西
6、總結
數據多的處理還是放在后端比較合適,畢竟可以利用分布式框架等多端計算。
而瀏覽器處理數據的能力還是有限。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。