地區(qū)
英國
美國
中國香港
新加坡
澳大利亞
院校庫
學校庫
專業(yè)庫
排名庫
認證查詢
英國選校
學員錄取
成功案例
錄取報告
本科戰(zhàn)績
南極星計劃
留學資訊
背景提升
背提項目
實習內推
高頻競賽
背提免費課
顧問團隊
資料庫
關于我們
服務項目
指南動態(tài)
聯系我們
App下載
本科留學
25Fall錄取合集
2025 QS
英國留學選校查詢
登錄
收獲QS Top 100統(tǒng)計學offer,我是如何學習數據分析技能的?
收藏已取消
收藏成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{!collectStatus ? '收藏' : '已收藏'}}
在線咨詢
收獲QS Top 100統(tǒng)計學offer,我是如何學習數據分析技能的?
收藏已取消
收藏成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{!collectStatus ? '收藏' : '已收藏'}}
指南者留學 Journey
2022年06月22日
閱讀量:1887
<p style="text-align: justify;"><strong>學員背景</strong><br />F同學<br /><strong>本科背景</strong><br />廣東財經大學 應用統(tǒng)計專業(yè)<br />GPA 81.1 雅思7<br />指南者商業(yè)分析項目實戰(zhàn)學員<br /><strong>錄取學校(2022年秋季入學)</strong><br /><a href="http://identitytheftpreventionsite.com/majr_51285" target="_blank" rel="noopener"><span style="text-decoration: underline; color: #1890ff;">南安普頓大學(QS排名78) 應用統(tǒng)計學專業(yè)</span></a><br /><strong>背提戰(zhàn)績</strong></p> <p style="text-align: justify;"><img style="width: 371px; height: 521px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpnyHSzV.jpg" width="371" height="521" /></p> <p style="text-align: justify;">前言:</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">距離項目結束已經過去兩個月了,當時參加這個項目的情形還歷歷在目。我是在今年1月初的時候報名這個項目的,其實當時最擔心的問題是這個項目會不會很水,因為網絡上一直詬病于這些項目,但當我真正參與到課程中去的時候,我發(fā)現我的想法是錯誤的。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">項目中很多地方對我影響很大,當然我也受益其中,這個項目強化了我的專業(yè)技能(提前學習數據分析和挖掘建模方面的技能),豐富了我的實踐經歷,對我之后拿到研究生offer有直接有力的幫助。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">01 背景與契機</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">一開始選擇參加指南者的背景提升項目,是因為覺得自己的項目經歷太少再加上自己是雙非學校的背景,缺少具體的實戰(zhàn)經驗,大學里參加的項目也很少。即使我是應用統(tǒng)計專業(yè),在學校里學了R語言和SQL,但是<strong>Python的實際應用一直是我的弱點</strong>,所以基于這個想法,我想參加一個提升個人編程能力的項目。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">考慮到我后期我想申請港校和英國商業(yè)分析的方向,擁有相關的背景經歷也是非常有必要的,<strong>國外的學校在BA這塊的錄取會特別注重申請者的數據分析和建模能力以及實踐經驗</strong>,這些都是我當時比較缺少的幾點吧。包括我直系的師兄師姐和顧問老師也跟我說擁有幾段與碩士項目相似的經歷會大大提高成功的概率,因為能體現出自身與項目的匹配度。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">同時我未來的就業(yè)方向也是想往數據分析和商業(yè)分析這兩個方向,所以提前了解這個領域所必備的技能對以后就業(yè)或找實習都會有一定的好處?;谶@幾點,我決定參加這個項目提升自己的背景與能力,最終收獲滿滿。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">02 項目介紹</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">我參加的這個項目的名字叫做基于電商大數據零食市場的分析,這個項目主要是收集各類淘寶村的店鋪數據和商品價格、銷量和人氣等數據,以可視化和挖掘建模的方式解讀農村淘寶的經濟特征,從商品特色、品質和口碑等方面,共同探究淘寶村如何實現興農扶貧的目標。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">本次項目的授課老師——王老師,他在bilibili平臺的Tableau可視化視頻幾年來穩(wěn)居第一,而且他本人也曾經在世界知名的咨詢公司工作過很多年,能夠真正給到我一些很實用的建議,所以個人覺得同學們完全可以大膽去報名這個項目。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">關于學習的內容,總共分為六大節(jié),上課所用到主要是以<strong>SQL、Python</strong>這兩大軟件為主,包括SQL的增刪改查、Python與numpy基礎、pandas、多分類問題、語義情感分析、預測與相關因素分析,最牛的莫過于是利用百度智能云進行語句情感得分分析,直接調用一段代碼就可以了,大大減少了代碼的書寫時間提高了效率,關鍵<strong>這是我從來沒有在學校的一門課程里接觸到類似的知識</strong>,我認為這也是項目中的一個亮點之一,緊跟現在人工智能的一個潮流。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">03 準備過程</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">即使我是學統(tǒng)計專業(yè),但在實際的操作中也會遇到不少“困難”,有一些是十分低級的錯誤,比如使用jupyter notebook的時候把小窗口直接關掉,導致了程序無法正常運行,但是王老師還是十分耐心地告訴我一些需要注意的地方。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">這個項目里需要每周一次作業(yè),來檢查同學們的聽課情況,因為當時在寫畢業(yè)設計,時間分配和把控上做得不是很好,沒怎么認真聽課。所以想一次性利用課程的課件把作業(yè)完成好然后交給老師,但是沒想到當中遇到不少問題,在群上詢問老師意見,一下子就被老師發(fā)現了,老師很嚴厲地批評了我,并語重心長地對我說:<strong>編程是需要時間去練習的</strong>。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">從那時開始,我每周的課都聽三遍,并將代碼自己再運行一遍,務必讓自己每一個知識點都掌握好,這樣操作下來感覺就沒有特別大的問題了,因為很多難點都是老師所設計好的,相信自己一定是可以掌握的,還有給我的啟示就是日常需要有目的性地去練習編程,提高個人的編程能力,比如在??途W、leetcode上多刷題,這些才是<strong>真正為以后就讀研究生甚至是就業(yè)做好充分的準備</strong>。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">04 項目實戰(zhàn)</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">經過一個多月的學習之后,我對Python和SQL已經掌握得差不多了,在課程的最后就是需要進行項目實操。個人猜測,老師應該運用了web scraper插件在天貓上爬取了近3000多條數據以及商品的評論區(qū)的數據,我們參加項目的同學進行后續(xù)的操作。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">首先基本操作,先導入numpy和pandas包,然后對excel表格里的數據進行處理,因為正常情況下獲取的數據都是會有異常值與缺失值,所以我依照老師在課程上講過的處理方法,利用pandas庫對二維數據表對空白值去除填充,并且定義新函數對發(fā)貨地址的省份與城市實現Excel中的分列功能,最后運用數組與集合等知識來對列中不規(guī)則的信息有效提取出來,以獲得商品的具體分類。在這個過程中,老師還經常提醒我們要定期對表內的信息進行檢查,不然會影響到后續(xù)的操作。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">這個項目中最精彩的部分估計就是<strong>Tableau</strong>部分了,做出很多意義的圖表,但我一開始沒有什么方向,十分著急,不知道怎么辦好。后面老師給出不同的方向,發(fā)貨地址、店鋪銷量分析、單品分析,并且利用詞云wordart 做出評論區(qū)頻次最高的詞匯,消費者對產品的態(tài)度一目了然。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">當然這些僅僅停留在描述統(tǒng)計的范疇里面,是經不起考驗的。后面我們需要借助統(tǒng)計模型建立多元線性回歸模型和PCA模型,利用相關理論進行必要的降維,導入seaborn和matplotlib包最后繪制出熱力圖,不同變量之間的相關性通過顏色的深淺就可以看出。最后利用<strong>百度智能云情感分析系統(tǒng)</strong>對商品評論內容進行分析,這一步的操作行云流水,十分體現技術,因為在實際處理中,用戶會輸入很多表情,這些都屬于異常字符,都需要進行過濾,所以老師介紹了try…except…的解決方案,完美避開了表情包的干擾,這樣能使工具能夠順利進行,最后計算出同一產品的中位數,并繪制頻率密度直方圖,這樣就可以更清晰地反映用戶的情感得分分布,對后續(xù)的商家的運營策略調整具有積極性意義。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">05 個人感受</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">我之前一直覺得SQL和Python在實際工作用到的情況十分少,我本人對我自己的Excel水平十分自信,覺得Excel應該可以處理大部分數據分析的問題了,Python就是算法和爬蟲工程師需要做的事。但是面對十分大的數據量的時候,上萬條數據的時候Excel就可以不管用了,可以說是內存不夠,Python和SQL則可以改善這些缺點,在電腦里相當于是建立了一個虛擬內存,處理數據起來就會十分快捷,這也是<strong>Excel無法達到的高度</strong>,所以<strong>如果以后要吃數據分析這口飯,Python和SQL真的能決定這一份職業(yè)的上限。</strong></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">目前我拿到了南安普頓大學應用統(tǒng)計專業(yè)的offer,很感謝這個項目給予我的幫助,也增強了我對數據分析技能的信心,當然想要成功,單靠這個課程是不夠的,還需要自身在日常生活中不斷耕耘,在實際數據分析操作中不斷查缺補漏,老師說的話和這股信念鼓勵著我一定要一直走下去。</p> <hr /> <p style="text-align: justify;"><img style="width: 750px; height: 3631px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/sucai/content/1655890266471/1655890266472.png" width="750" height="3631" /></p>
猜你喜歡
壓績點是壞文明
1465
死磕雅思沒用,有人不是那塊料
1394
海外名校1v1科研:基于深度學習的中國租房通脹預測|收獲一作論文與導師推薦信!
21568
背景提升學員|喜報!新國立、南洋理工、港大、港城、悉尼大學、曼大、華威、伊利諾伊香檳分校offer來了!
21618
對機器學習感興趣?不如先來實踐一下!|《特斯拉車輛故障自動檢測系統(tǒng)》
21518
曼大范教授1v1科研:溫和條件下CO2催化制甲醇:新型催化劑的研發(fā)|收獲一作論文與導師推薦信!
21492
預約咨詢
預約咨詢
七日熱點資訊
申請量暴增155%!港新留學持續(xù)升溫,英國院校慘遭冷落,25Fall錄取高峰期即將到來?
突發(fā)!新南威爾士大學撤銷25fall所有con offer!大規(guī)模限額下,留學生該何去何從?
“秋招遭遇性別歧視后,我放棄了年薪15萬的工作”,告別內卷,985學姐無痛拿下港大、新國立offer!
中國女生海外替考雅思被捕!港大、墨大突然官宣提高語言要求,造假頻發(fā)后雅思也貶值了?
“在帝國理工,掛科是常態(tài)。”一天至少學8小時,我在帝國理工學院仿佛回到了高中......
突發(fā)!紐約大學提前關閉申請通道,美國留學需要趕“早班車”嗎?
微信咨詢
掃一掃立即咨詢
App下載
下載指南者留學App
在線客服
電話咨詢
400-183-1832
回到頂部
預約咨詢
登錄
二維碼已過期
重新獲取
已掃碼
等待確認登錄
請使用微信掃描二維碼登錄
現在來設置你的賬號吧
只需要花不到一分鐘,之后便可以獲得更精準的推薦~
1
留學意向
2
基本意向
3
詳細背景
4
了解途徑
1.1 您期望申請學歷是
1.2 您期待的留學地區(qū)是
多選
2.1 您的身份狀態(tài)是
2.2 您的目前學歷是
3.1 您的本科學校是
大陸本科
海外本科
3.2 您的學校名稱是
沒有查詢到相關的學校
查詢中...
3.3 您的專業(yè)名稱是
沒有查詢到相關的專業(yè)
查詢中...
4. 您了解到我們的途徑是
取消
上一步
下一步
復制
復制
您的會員等級不足,查看等級詳情
立即前往
選擇收藏夾
新增收藏夾
{{option.remark_name}}
默認
{{option.info_count}}條內容
取消
完成
新增收藏夾
設為默認收藏夾
返回
{{ form.id ? '完成編輯' : '確定創(chuàng)建' }}
是否放棄編輯內容?
取消
確定