ماشین لرنینگ

میخوام دیتا ساینتیست بشم چکار کنم؟

خیلی ها، خیلی زیاد، از من در این باره میپرسن که میخوام دیتا ساینتیست بشم چکار کنم؟

واقعیت اینه که راهنماهای زیادی برای دیتا ساینتیست شدن هست که همشون هم معمولا سعی در این دارن که همه چیز رو تو این حوزه، سخت و نیازمند به دانش پیشین گسترده معرفی کنن. ولی واقعیت این هست که این کار هم مثل همه حوزه های دیگه نیاز به پشتکار و علاقه داره. اگر دارید بقیه مطلب رو همراه من باشید.

 

من لیستی از سوالات و مواد لازمی که بنظرم خوب میاد رو میارم. طبیعی هست که اپدیت اش میکنم . چیزای بیشتر و بهتری اگر دیدم بهش اضافه میکنم.

من برنامه نویس نیستم چه زبانی رو باید بدونم؟ زبان های R و Python بهترین و سریعترین هستن. بشخصه پایتون رو معرفی میکنم به همه چون بنظرم راحت تر راه افتادم و خب یه موقع بخواهید سرویس جدی ارائه بدید واقعا سر تر هست نسبت به R. از طرفی R مقداری هلو بپر تو گلو تر هست و این باعث میشه خیلی عمیق یاد نگیرید موارد اولیه رو. لازم هست بدونین که شما نیاز نیست خیلی برنامه نویس خفنی باشید برای اینکه بتونید کار رو شروع کنین. صرفا چهارتا چیز ساده رو یاد بگیرید کافی هست. شاید دوره جادی برای پایتون استارت خوبی باشه و باید بدونید همون دوره مقدماتی همه نیاز شما رو به طور کامل پوشش میده و تو مباحث تخصصی هم که خدا پدر استک و گوگل رو بیامرزه. مورد داشتیم من یه سرویس رو از صفر تا صد با گوگل نوشتم دادم دست مشتری خیلی هم راضی بودن :))

چقدر باید زمان بذارم؟ این رو هرکسی از من میپرسه حس بدی رو بهم منتقل میکنه. بنظرم حوزه دیتا رو اگر علاقه ندارید به سمتش نرید. واقعا چیزی گیرتون نمیاد غیر از چهار تا عبارت قلمبه سلمبه بیمصرف که دیگه الان همه بلدن. اگر هم علاقه دارید که دیگه هرچی در توان تون هست بذارید. من زن و بچه دارم. کار هم میکنم تا حدی که کمرم اجازه بده و با این حال همچنان روزی ۳-۵ ساعت مطالعه میکنم. و مایلم به اطلاعتون برسونم با این نرخی که من وقت گذاشتم یک سال طول کشید که به جایی برسم که بتونم مساله واقعی حل کنم و سرویس رو به پروداکشن برسونم. این رو هم به خاطر داشته باشید که من قبل تر ها برنامه نویس محاسباتی بودم و خب با اعداد خیلی راحتم و شاید شما مجبور باشید وقت بیشتری بذارید یا… دیگه خودتون میدونین. دیتا عشقِ عشق 🙂 این شما و علاقه مندی تون هست که مشخص میکنه کی به نتیجه میرسید. من خیلی دور باطل زدم برای اینکه به نتیجه برسم و شما میتونین من رو آینه عبرت قرار بدین و راههای بهتری رو پیدا کنین.

ریاضیات چی میخواد؟ این رو معمولا کسی از من نمیپرسه. یه سری سایتها هم ازین چرندیات که بدون دونستن ریاضی دیتاساینتیست بشوید و بلا بلا بلا رو زیاد میگن. راستش شما به مقداری جبر خطی نیاز دارید. طبیعتا اشنایی ابتدایی با حساب دیفرانسیل هم گاهی کمک میکنه ولی جبر خطی از همه مهمتر هست. برای اشنایی با جبر خطی بنظرم بخش های اغازین کتاب دیپ لرنینگ شاهکار Ian Goodfellow  رو از دست ندید.کلا این کتاب کل ریاضیات رو پوشش میده. اصلا نترسید. کلا خیلی ساده است موضوع. اسمش یه جوری عجیب غریب هست.

یه زبونی رو بلدم و از ریاضیات ابتدایی هم سر درمیارم و اون مقاله رو هم خوندم حالا چکار کنم؟ خب. رسیدیم به جایی که خیلی مهم هست. اینجا جایی هست که به هیچ عنوان نباید اشتباه مهلک من رو تکرار کنین. من اساسا تا یه موقعی بشدت مطالعه میکردم و انقدر مطالب مختلف رو خونده بودم که اساسا تو حرف زدن حتی دانشجوهای ارشد هوش مصنوعی هم کم میاوردن جلوم. ولی در عمل، هیچی :/ شما نباید به هیچ وجه دنبال این باشید که به روز باشید و همه چی رو تا تهش بدونین و … شما باید تا میتونید toy example حل کنین. این باعث میشه که هم دستتون روون بشه تو ماجرا. هم اینکه مسائل واقعی رو لمس کنین. کنارش هم ۴ تا چیز یاد بگیرید و دقیقا متوجه میشید که حوزه مورد علاقه تون کجاست؟

این دیپ لرنینگ چیه؟ توصیه برادرانه من به شما این هست که فعلا بیخیال این فیلد بشید.این که چرا بیخیال بشید رو در یه مطلب دیگه بهش میپردازم. فعلا همینقدر بدونین که این بیشتر یه هایپ هست بنوعی و اصلا اونطوری که فکرشو بکنین کاربرد جدی نداره تو صنایع و هنوز بیشتر تو حوزه ریسرچ ترند هست نه تو صنعت. الان ۴ تا مثال نقض برام میارین. اونا رو میدونم. ولی بیش از نود درصد مسائل فعلی حوزه دیتا رو همین روشهای مرسوم ماشین لرنینگ حل میکنن پس بخاطر اون ده درصد کافه رو اتیش نزنین لطفا.

منابع خوب چیا است؟ اول از همه بهترین مطلب برای شروع به زبان فارسی قطعا مطلب سایت zerotohero.ir هست. این مطلب یه دوره خوب هست که ترجمه ای از یه مقاله انگلیسی هست. طبیعتا توصیه میکنم مقاله اصلی که خودش چندین پارت هست رو بخونین. ولی برای شروع همین مطلب خیلی خوب هست.این مطلب به شما یاد نمیده که فلان مساله رو چجوری حل کنین ولی بهتون این دید رو میده که لااقل این کلمه یادگیری/لرنینگ یعنی چی اصلا؟! ممکن هست همون اول دل شما رو بزنه و دیگه نخواهید ادامه بدید یا اینکه علاقمند بشید و خیلی هم پیگیری کنین. من یکی دوتا سایت رو چک میکنم معمولا روزانه. برخی ها شون رو هم مشترک هستم و همه زیر مجموعه مدیوم هستن. اگر خواستید باید لیست همه شون رو دربیارم ولی بطور کلی این  سایت رو از دست ندید.  https://towardsdatascience.com/

 

 

نمایش بیشتر

MINIMAL

مینیمال هستم. کاری داشتید با توییترم در تماس باشید.

8 دیدگاه در “میخوام دیتا ساینتیست بشم چکار کنم؟”

  1. یه جوری نوشتید «کلا این کتاب کل ریاضیات رو پوشش میده. اصلا نترسید» که انتظار داشتم در فهرست کتاب جدول ضرب جزو اولین مباحث باشه! برای منی که بدلیل به حد نصاب نرسیدن نمراتم، انتخابی جز رشته علوم انسانی نداشتم و در دانشگاه به ضرب و زور اعتراض به نمره امتحان و کمک استاد گرانقدر، ریاضی رو پاس کردم، این کتاب کمکی نمی کنه، ای کاش لطفی کنید و یه پست اختصاصی راجع به ریاضیات بنویسید و بگید که از جدول ضرب (البته اینو بلدم ☺️) تا همین جبر خطی (من خطاب به جبر خطی: گودزیلاهای قبل از تو توهم بود) یا بالاتر رو چجوری و با چه منابعی میشه یاد گرفت.
    البته من از بدو تولد تنبلی و بی علاقه گی خاصی به درس و دانشگاه داشتم که شاید مهمترین دلیل دوری من از ریاضیات در گذشته باشه.
    با تشکر از شما

    1. سلام
      والا چیزی که میخوای رسما آموزش ریاضی راهنمایی و دبیرستان هست. حقیقتا این کار سختی هست و به هیچ عنوان تخصص من نیست.
      برای شروع این کتاب واقعا شما نیاز به چیزی جز مباحث پایه ای ندارید. ولی اگر علاقه‌مند هستی به موضوع میتونی با یک لیسانس ریاضی یا معلم ریاضی مشورت کنی که پایه های مورد نیاز که شما نداری چیا هستن و همونا رو بخونی.
      در نهایت هم برنامه نویسی کلا کار هلو بپر تو گلویی نیست، دیتا ساینتیست شدن اصلا همچین چیزی نیست. بنظرم اومد بدون تلاش و زحمت میخوای بیای به این سمت. قبل از همه اینها باید رو mind set ات کار کنی بنظرم

      1. سلام از ماست 😬
        البته یه چند سالی هست که بصورت غیر حرفه ای برنامه نویسی رو دنبال میکنم و غریبه نیستم. ولی خب از ریاضیات خیلی فاصله گرفتم، اینم که گفتم تنبل بودم راجبش بیشتر بخاطر این بود که تصور می‌کردم در آینده هیچ کاربردی برام نخواهد داشت. تلاشم رو خواهم کرد. ممنون از وقتی که گذاشتید.

  2. خیلی ممنون از مطلبتون, این مطلب رو چند بار خوندم و واقعا عالیه, فقط چند تا سوال داشتم:
    اگر بخش اول(ریاضی) کتاب اقای Ian Goodfellow رو بخونم برای شروع کافیه یا باید یک کتاب مفصل درباره جبر خطی و آمار بخونم و کدوم به نظرتون بهتره.
    سوال دومم اینه که فکر میکنید برای کسی که ماشین لرنینگ و امثال اونو بلده تو ایران کار به اندازه براش هست.
    بازم خیلی ممنون, از وقتی توی توییتر صفحه شما رو دیدم شروع به یادگیری ماشین لرنینگ کردم, قبلا هدفی توی برنامه نویسی برای خودم نداشتم.

    1. برای ریاضی همون مطلب کافی هست.
      برای کسی که هرچیزی رو خوب بلده کار هست تو ایران. ماشین لرنینگ اینده رو به رشد تری رو داره نسبت به الباقی حوزه های نرم افزار

  3. سلام ممنون از مطلب خوبتون
    اینکه زبان برنامه نویسی باید پایتون یا آر باشه خیلی ضروریه؟ مثلن من که سی شارپ و جاوا کار میکنم نمیتونم از این زبانها استفاده کنم تو این حوزه؟ و سوال دیگه این هست که من الان هیچ درک درستی از دیتا ساینتیست ندارم که چطور با ترکیب این دانش ها (ریاضی، آمار، برنامه نویسی، هوش مصنوعی) می تونن رو داده ها کار کنن ! میشه تو یه مثال عملی توضیح بدید که دقیقن یک دیتا ساینتیست چی کار میکنه؟ ممنون

    1. نه زبان اهمیتی نداره. کتابخونه های زیادی هستن برای زبون های مختلف. جاوا خیلی کیس خوبی هست بنظرم.
      مثال رو تو متن اوردم. اونجا که گفتم برای شروع این رو بخونین 🙂

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

چهار × 2 =

بستن