Mga Wika upang Maging isang Agham ng Agham ng Data
Wika at Agham (Fil 40 Final Project)
Talaan ng mga Nilalaman:
Ang bawat tao'y nagnanais na ang kanilang karera ay nasa mataas na demand-dahil ang pangangailangan ay sinasalin sa mahusay na suweldo at walang kakulangan ng trabaho. Sa mga araw na ito, ang malaking espasyo ng data ay puno ng ganitong uri ng trabaho, dahil ang mga kumpanya ng lahat ng laki ay kailangan upang mangolekta at pag-aralan ang impormasyon upang makagawa ng mga pagpapasya at mga hula (at makakuha ng mga resulta).
Iyon ay tiyak kung ano ang ginagawa ng mga siyentipiko ng data: matuklasan ang impormasyon, gumawa ng mga koneksyon, lumikha ng mga visualization ng data, at tulungan ang mga kumpanya na gumana nang mahusay. At ang isang masusing pag-unawa sa mga tamang programming language ay mahalaga para sa pagbibigay-kahulugan sa mga istatistika at nagtatrabaho sa mga database.
Ayon sa KDnuggets, 91% ng data na ginagamit ng mga siyentipiko ang sumusunod na apat na wika.
Wika 1: R
R ay isang istatistika-oriented na wika na popular sa mga miners ng data. Ito ay bukas-pinagmulan, pagpapatupad ng object-oriented ng S, at hindi masyadong mahirap matutunan.
Kung nais mong malaman kung paano bumuo ng statistical software, R ay isang magandang wika na malaman. Pinapayagan din nito na manipulahin mo at graphically ipakita ang data.
Bilang bahagi ng kanilang programa sa Pagtuturo sa Data Science, nag-aalok ang Coursera ng isang klase sa R na hindi lamang nagtuturo sa iyo kung paano mag-program sa wika kundi pati na rin kung paano ito ilalapat sa konteksto ng agham / pagsusuri ng data.
Wika 2: SAS
Tulad ng R, SAS ay pangunahing ginagamit para sa statistical analysis. Ito ay isang makapangyarihang kasangkapan para sa pagbabago ng data mula sa mga database at mga spreadsheet sa nababasa na mga format (tulad ng mga dokumentong HTML at PDF) pati na rin ang higit pang mga visual na mga talahanayan at mga graph.
Orihinal na binuo ng mga akademikong mananaliksik, naging isa sa mga pinaka-popular na tool sa analytics sa buong mundo para sa mga kumpanya at organisasyon ng lahat ng uri. Ito ay higit pa sa isang malaking uri ng korporasyon ng software at hindi karaniwang ginagamit ng mas maliliit na kumpanya o indibidwal na nagtatrabaho sa kanilang sarili.
Ang mga mapagkukunan para sa pag-aaral ng SAS ay nakalista sa dokumentong ito. Ang wika ay hindi bukas-pinagmulan, kaya malamang na hindi mo magagawang magturo sa iyong sarili nang libre.
Wika 3: Python
Kahit na ang R at SAS ay karaniwang naiisip na bilang "ang malaking dalawang" sa mundo ng analytics, si Python ay kamakailan lamang ay naging isang kalaban. Ang isa sa mga pangunahing perks nito ay ang iba't ibang uri ng mga aklatan (hal. Pandas, NumPy, SciPi, atbp.) At mga statistical function.
Dahil ang Python (tulad ng R) ay isang open-source na wika, ang mga pag-update ay mabilis na idinagdag dito. (Sa binili na mga programa tulad ng SAS, kailangan mong maghintay para sa susunod na release ng bersyon.)
Ang isa pang kadahilanan upang isaalang-alang ay ang Python ay marahil ang pinakamadaling matutunan, dahil sa pagiging simple nito at ang malawak na kakayahang magamit ng mga kurso at mga mapagkukunan dito. Ang website ng LearnPython ay isang magandang lugar upang magsimula.
Maaari ka ring makahanap ng isang buong listahan ng mga materyales sa pag-aaral ng Python.
Wika 4: SQL
Sa ngayon kami ay naghahanap sa mga wika na nasa parehong pamilya at (higit pa o mas mababa) ay may parehong mga function. Ang SQL, na kumakatawan sa "Nakabalangkas na Wika ng Query," ay kung saan ang mga pagbabagong iyon. Ang wikang ito ay walang kinalaman sa mga istatistika; ito ay nakatutok sa paghawak ng impormasyon sa mga pamanggit na mga database.
Ito ay ang pinakalawak na ginagamit na wika ng database at bukas na pinagmulan, kaya ang mga siyentipikong data na siyentipiko ay tiyak na hindi dapat laktawan ito.
Ang pag-aaral ng SQL ay dapat na magbigay sa iyo upang lumikha ng SQL database, pamahalaan ang data sa loob ng mga ito, at gamitin ang mga may-katuturang pag-andar. Nag-aalok ang Udemy ng isang kurso sa pagsasanay na sumasaklaw sa lahat ng mga pangunahing kaalaman at maaaring makumpleto nang pantay-pantay nang mabilis at painlessly.
Konklusyon
Sa pinakamaliit, malamang na matutunan mo ang SQL at pumili ng hindi bababa sa isa sa mga istatistika ng wika. Ngunit kung mayroon kang oras (at sa kaso ng SAS, pera) at nais na talagang hanggang sa iyong marketability, walang saysay na hindi mo maaaring matutunan ang lahat ng apat na!
Huwag magmadali, kumuha ng maraming pagsasanay, ihanda ang iyong mga kasanayan-at tamasahin ang seguridad sa trabaho.
Mga Hacks sa Katawan ng Wika upang Tulungan ang mga Babae na Magtamo ng Magagawa sa Trabaho
Ang komunikasyon ng Nonverbal ay nagsasalita ng mga volume, lalo na para sa mga kababaihan sa negosyo. Sundin ang mga tip na ito kung paano maaaring i-hold mo ang wika ng wika-o matulungan kang makakuha ng maaga.
Listahan ng Mga Agham at Mga Halimbawa ng Mga Siyentipiko ng Data
Ang data ng siyentipiko ay pinag-aaralan ang data upang malaman ang tungkol sa mga prosesong pang-agham. Ang listahan ng mga kasanayan na ito ay maaaring gamitin para sa mga resume, cover letter, at mga interbyu sa trabaho.
Mga Trabaho para sa Mga Pag-aaral ng Pangkapaligiran / Agham ng Agham
Isaalang-alang ang mga opsyon sa karera para sa mga mahahalagang science sa kalikasan, kabilang ang kinakailangang mga kasanayan at paglalarawan sa trabaho.