Та өгөгдлийн шинжлэх ухааныг сонирхож, түүний үндсийг судалж байна уу? Дата судлаач болох амаргүй. Цаашилбал, олон жилийн шаргуу хөдөлмөр, хичээл зүтгэл шаардагдана. Дата шинжлэх ухааны номны зөв жагсаалтын тусламжтайгаар та энэ салбарт амжилтанд хүрэхийн тулд бүх чухал мэдээллийн шинжлэх ухааны ойлголтуудыг сурах боломжтой болно. Өгөгдлийн шинжлэх ухаан нь бизнес, академи, засгийн газрын олон хэрэглээтэй, хурдацтай хөгжиж буй салбар юм.
Шийдвэр гаргахдаа өгөгдөлд тулгуурладаг байгууллагууд улам олон болж байгаа тул мэдээлэл судлаачдын эрэлт урьд өмнө байгаагүй. Гэсэн хэдий ч ийм өндөр эрэлт хэрэгцээтэй холбоотойгоор маш их өрсөлдөөн бий болдог. Шилдэг өгөгдөл судлаач болохын тулд энэ салбарын хамгийн сүүлийн үеийн чиг хандлага, хөгжлийг тасралтгүй сурч, цаг тухайд нь авч байх нь чухал юм. Мэдээллийн шинжлэх ухааны номууд нь таныг муруйгаас түрүүлж, хөдөлмөрийн зах зээлд өрсөлдөх чадварыг бий болгоход тусална.
Өгөгдлийн шинжлэх ухааны үзэл баримтлалын талаарх ойлголт, хэрэглээг сайжруулахын тулд унших хамгийн шилдэг мэдээллийн шинжлэх ухааны номуудыг энд оруулав.
1. Foster Provost, Tom Fawcett нарын бизнесийн мэдээллийн шинжлэх ухаан
Энэ бол өгөгдөлд тулгуурласан шийдвэр гаргах практик хүрээг хангасан мэдээллийн шинжлэх ухааны ном юм. Энэ нь мэдээллийн шинжлэх ухааны танилцуулга, үндсэн ойлголт, арга техникийг хэлэлцэхээс эхэлдэг. Дараа нь маркетинг, санхүү, үйл ажиллагааны тодорхой хэрэглээнд шилждэг. Номын туршид зохиогчид бодит жишээнүүдийн хамт ойлголтуудын талаар тодорхой бөгөөд товч тайлбарыг өгдөг. Үүнд бизнесээ сайжруулахын тулд дата шинжлэх ухааныг амжилттай ашигласан компаниудын жишээнүүдийн судалгаа багтсан болно. Өгөгдлийн шинжлэх ухаанд амжилтанд хүрэхийн тулд та өгөгдөлд дүн шинжилгээ хийх, түүнчлэн харилцах, санаа бодлоо бичих чадвартай байх ёстой.
2. Өгөгдлийн шинжлэх ухааны танилцуулга Жеффри Стэнтон
Хэрэв та өгөгдлийн шинжлэх ухааны талаар мэдэх ёстой бүх зүйлийг зааж өгөх дэлгэрэнгүй гарын авлагыг хайж байгаа бол Жеффри Стэнтоны "Өгөгдлийн шинжлэх ухааны танилцуулга" номыг үзээрэй. Энэ нь математикийн арга, алгоритмаас эхлээд өгөгдлийг дүрслэх, машин сурах зэрэг бүх зүйлийг хамардаг.
Энэ нь мөн бодит жишээнүүдийн дэлгэрэнгүй тайлбарыг өгдөг бөгөөд ингэснээр эдгээр бүх ойлголтууд практик дээр хэрхэн хамтран ажилладагийг харах боломжтой болно. Энэхүү ном нь өгөгдлийн шинжлэх ухааны үндсийг уялдаа холбоотой, ойлгомжтой байдлаар сурахыг хүссэн хэн бүхэнд тохиромжтой гарын авлага юм. Энэ нь таны ирээдүйн карьер ямар байхаас үл хамааран үнэ цэнэтэй ур чадварыг хөгжүүлэхэд тань туслах болно.
3. Журе Лесковец, Ананд Ражараман нарын их хэмжээний мэдээллийн багц олборлолт
Их хэмжээний өгөгдлийн багцын олборлолт нь 2011 онд хэвлэгдсэн ном бөгөөд өгөгдлийн шинжлэх ухааны хамгийн нөлөө бүхий номуудын нэг болжээ. Үүнийг Журе Лесковец, Ананд Ражараман нар бичсэн бөгөөд том өгөгдлийн багцад өгөгдөл олборлоход тулгарч буй сорилтуудыг авч үздэг. Энэ номыг уншсаны гол давуу талуудын нэг нь дата олборлолтын үндсэн ойлголтуудыг ойлгоход тань туслах болно.
Энэ нь танд илүү нарийн төвөгтэй асуудлыг илүү нарийвчлалтай, үр дүнтэй шийдвэрлэх боломжийг олгоно. Нэмж дурдахад, энэ нь компьютер хэрхэн ажилладаг талаар илүү сайн ойлголттой болоход туслах бөгөөд энэ нь том өгөгдөлтэй ажиллахад давуу тал болно. Ерөнхийдөө энэ бол өгөгдлийн шинжлэх ухааныг гүнзгийрүүлэн сурахыг хүссэн хэн бүхэнд зайлшгүй шаардлагатай ном юм. Энэ нь маш сайн бичигдсэн бөгөөд бодит ертөнцийн асуудлыг шийдвэрлэхэд ашиглаж болох баялаг мэдлэгийг өгдөг.
4. Эрик Сигелийн урьдчилан таамаглах аналитик
Эрик Сигелийн "Таамаглах аналитик" нь өгөгдлийн аналитиктай холбоотой өргөн хүрээний сэдвүүдийг хамарсан мэдээллийн шинжлэх ухааны ном юм. Энэ нь өгөгдлийн аналитик болон өгөгдлийн шинжлэх ухааны үндсийг тайлбарлах ажлыг маш сайн гүйцэтгэдэг. Энэ нь урьдчилан таамаглах загварчлал болон өгөгдөл олборлолтын талаарх дэвшилтэт ойлголтыг өгдөг. Ном сайн бичигдсэн бөгөөд ойлгоход хялбар. Эдгээр онцлогууд нь үүнийг мэдээллийн шинжлэх ухааны талаар илүү ихийг мэдэхийг сонирхож буй хэн бүхэнд маш сайн эх сурвалж болгодог. Нэмж дурдахад уг номонд бизнесийн шийдвэр гаргалт болон бусад боломжит хэрэглээг сайжруулахад урьдчилан таамаглах аналитик хэрхэн ашиглаж болохыг харуулсан олон практик жишээг багтаасан болно.
5. Хадли Викхэм, Гарретт Гролемунд нарын Data Science-д зориулсан R
Hadley Wickham, Garrett Grolemund нарын "R for Data Science" ном нь R програмчлалын хэл ашиглан өгөгдлийн шинжлэх ухаанд суралцахыг хүссэн хэн бүхэнд зайлшгүй шаардлагатай гарын авлага юм. Энэ нь өгөгдлийн маргаан, хайгуулаас эхлээд өгөгдлийг дүрслэх, машин сурах зэрэг өргөн хүрээний сэдвүүдийг хамардаг. Бүлэг бүрт зохиогчид тодорхой тайлбар, үндсэн ойлголтуудыг тайлбарлах алхам алхмаар жишээг өгдөг.
Үүний үр дүнд R for Data Science нь эхлэгч болон туршлагатай өгөгдөл судлаачдад зориулсан маш сайн эх сурвалж юм. Өгөгдлийн маргаан, дүн шинжилгээ хийх, дүрслэн харуулах хэрэгслүүдийн цуглуулга болох эмх цэгцтэй байдалд анхаарлаа төвлөрүүлснээр энэ ном нь мэдээллийн шинжлэх ухааныг заавал сонирхдоггүй R хэрэглэгчдэд үнэ цэнэтэй байх болно.
6. Гарет Жеймс, Даниэла Виттен, Тревор Хасти, Роберт Тибширани нарын статистикийн сургалтын танилцуулга.
Энэхүү ном нь мэдээллийн шинжлэх ухааны хамгийн шилдэг номуудын нэг гэж тооцогддог. Энэ нь оюутнууд болон мэргэжилтнүүдийн хэрэгцээтэй эх сурвалж болсон. Энэхүү ном нь уншигчдад статистикийн сургалтын арга, хэрэглээний талаар тодорхой бөгөөд товч тоймыг өгдөг. Нэмж дурдахад үндсэн ойлголтуудыг харуулахын тулд бодит өгөгдлийн багц ашигласан жишээнүүдийг багтаасан болно. Энэ нь энэхүү гарын авлагыг өгөгдлийн шинжлэх ухааныг сонирхож буй хэн бүхэнд үнэлж баршгүй эх сурвалж болгож байна. Та энэ салбарт ажиллаж эхэлж байгаа эсвэл ур чадвараа дээшлүүлэхийг хүсч байгаа эсэхээс үл хамааран Статистикийн сургалтын танилцуулга бол зайлшгүй унших ёстой.
7. Тревор Хэсти, Роберт Тибширани, Жером Фридман нарын статистикийн сургалтын элементүүд
The Elements of Statistical Learning бол мэдээллийн шинжлэх ухааны хамгийн алдартай номуудын нэг юм. Тревор Хасти, Роберт Тибширани, Жером Фридман нарын бичсэн уг ном нь мэдээллийн шинжлэх ухаанд зайлшгүй шаардлагатай төрөл бүрийн сэдвүүдийг хамардаг бөгөөд үүнд хайгуулын өгөгдлийн шинжилгээ, регрессийн загвар, машин сургалт гэх мэт. Уншигчид сурсан зүйлээ хэрэгжүүлэхэд нь туслах зорилгоор номонд бодит жишээнүүд болон кодын хэсгүүдээр дүүрэн байдаг.
Мэдээллийн шинжлэх ухааны оюутнуудад унших шаардлагагүй ч энэ чиглэлийн талаар илүү ихийг мэдэхийг сонирхож буй хүмүүст сайн эх сурвалж болгон ашиглахыг зөвлөдөг. Уг ном нь статистикийн сургалтын үндсийг сайн тайлбарлаж, уншигчдад ойлголтыг ойлгоход нь туслах олон кодын жишээг өгдөг.
8. Жеффри К. Вулдрижийн Нийгмийн шинжлэх ухаанд зориулсан Bayesian Analysis
Өгөгдлийн шинжлэх ухаан бол хөгжиж буй салбар бөгөөд өгөгдлийн шинжлэх ухааны номуудаас сонгоход хомсдол байхгүй. Гэсэн хэдий ч, Жеффри К.Вулдрижийн Нийгмийн шинжлэх ухааны Байесийн шинжилгээ нь энэ салбарын талаарх ойлголтоо гүнзгийрүүлэхийг хүссэн хэн бүхэнд онцгой сонголт юм. Вулдридж нь өгөгдлийн шинжлэх ухааны үндсийг мэргэжлийн түвшинд багтаасан бөгөөд мөн Байесийн дүгнэлт гэх мэт илүү дэвшилтэт сэдвүүдийг судалдаг. Энэхүү ном нь сайн бичигдсэн бөгөөд дагаж мөрдөхөд хялбар тул өгөгдлийн шинжлэх ухааны анхлан суралцагч болон мэргэжилтнүүдийн хувьд хамгийн тохиромжтой сонголт юм. Өгөгдлийн шинжлэх ухаан нь судалгаа хийх, дүн шинжилгээ хийх, их хэмжээний өгөгдлийг удирдах, бичих явдал юм.
9. Ian Goodfellow, Yosua Bengio, Aaron Courville нарын гүнзгий суралцах
Deep Learning бол Иан Гудфеллоу, Ёшуа Бенгио, Аарон Курвилл нарын бичсэн мэдээллийн шинжлэх ухааны ном юм. Энэ нь онолын тал болон практик хэрэглээг хамарсан гүнзгий сургалтын тоймыг өгдөг. Төрөл бүрийн алгоритмын төрлүүдийг тайлбарлахаас гадна өгөгдлийн урьдчилсан боловсруулалт, сүлжээний архитектурын дизайн, загвар тааруулах зэрэг сэдвүүдийг багтаасан болно. Үүний үр дүнд энэ нь өгөгдлийн шинжлэх ухаан, машин сурах сонирхолтой хэн бүхэнд тустай байх болно.
10. Thomas M. Mitchell-ийн машин сургалт
Томас М.Митчелл өөрийн номондоо өгөгдөл олборлох, онцлогийг сонгох, загвар сонгох, загварын үнэлгээ зэрэг дата шинжлэх ухааны үндсийг тодорхой бөгөөд товч танилцуулсан. Тэрээр мэдрэлийн сүлжээ, гүнзгий суралцах зэрэг илүү дэвшилтэт сэдвүүдийг хэлэлцдэг. Маш олон жишээ, алхам алхмаар тайлбар бүхий Machine Learning нь эхлэгчдэд зориулсан мэдээллийн шинжлэх ухааны хамгийн тохиромжтой ном юм. Гэсэн хэдий ч туршлагатай өгөгдөл судлаачид хүртэл Митчелийн тодорхой, сайн зохион байгуулалттай илтгэлээс суралцах зүйл олно.
Дүгнэлт
Мэдээллийн шинжлэх ухааны шилдэг номуудыг уншсанаар та өгөгдлийн шинжлэх ухааны үзэл баримтлалын бат бөх суурийг бий болгож, бодит нөхцөл байдалд ашиглах боломжтой болно. Нэмж дурдахад эдгээр ном нь програмчлал, статистик дүн шинжилгээ, машин сурах гэх мэт чухал ур чадварыг хөгжүүлэхэд тань туслах болно. Энэхүү мэдлэг, ур чадварын тусламжтайгаар та өгөгдлийн шинжлэх ухааны тасралтгүй өсөн нэмэгдэж буй салбарт ажлын байрны төлөө өрсөлдөхөд сайн бэлтгэгдэх болно.