یادگیری عمیق با پایتون
کارگاه یادگیری عمیق با پایتون
دی ۲۶, ۱۳۹۶
واژه‌نامه یادگیری عمیق
اردیبهشت ۱۴, ۱۳۹۷
گوگل کولب

مقدمه درباره محیط گوگل کولب

محیط گوگل کولب یکی از خدمات جدید گوگل است که به شما امکان می‌دهد از سرویس‌دهنده‌های قدرتمند گوگل برای استفاده از جی‌پی‌یو به صورت رایگان بهره ببرید. مطالبی که در اینجا بیان می‌شود، بیشتر به صورت کلی بوده و در کاربرد‌های دیگر گوگل کولب مانند کد‌هایی که خودتان خواهید نوشت، می‌تواند مورد توجه قرار بگیرد. در واقع، بیشتر کاربران این محیط کسانی هستند که در سیستم شخصی خودشان، پردازنده های گرافیکی قوی ندارند و موقع کار با ساختار شبکه‌های عصبی و به‌خصوص شبکه‌های عصبی عمیق به مشکل جدی برخورد می‌کنند. از این رو، با توجه به اینکه گوگل کولب به صورت رایگان در دسترس عموم قرار داشته و همچنین از سیستم نسبتا قدرتمندی برخوردار است، می‌تواند جایگزین بسیار مناسبی برای سیستم شخصی این افراد به شمار رود.

محدودیت‌ها

البته، یک سری محدودیت‌ها به ویژه برای کاربران ایرانی وجود دارد که کمی کار کردن با آن را با مشکل روبرو کرده است. محیطی که در اختیار کاربران قرار داده، درست مثل محیط ژوپیتر نوت‌بوکی است که کسانی که به زبان پایتون برنامه نویسی می‌کنند، کاملا با این محیط آشنا هستند. در گوشه سمت راست این نوت‌بوک دکمه اتصال یا connect وجود دارد که با زدن این دکمه نوت‌بوک متصل شده و روی یک ماشین مجازی اجرا می‌شود. این نوت‌بوک به صورت مداوم به مدت ۱۲ ساعت می‌تواند متصل باقی بماند و بعد از این مدت بایستی یک ماشین مجازی جدید به آن اختصاص یابد و این به این معنی است که تمامی اعمالی که در داخل نوت بوک صورت گرفته بایستی مجددا انجام بگیرد.

محدودیت دیگری که بر روی این محیط اعمال کرده‌اند، تغییر ماشین مجازی نوت‌بوک است، چنانچه نوت‌بوک به مدت ۹۰ دقیقه بعد از آخرین اتصال خود در حالت قطع اتصال قرار بگیرد. از محدودیت‌هایی که می‌توان بیشتر برای کاربران ایرانی عنوان کرد، اعمال تحریم‌ها از سوی گوگل و لزوم استفاده از وی‌پی‌ان‌ها یا فیلترشکن‌ها موقع استفاده آن و به تبع آن سرعت پایین اینترنت و قطع اتصال شدن‌های نسبتاً زیاد نوت‌بوک در هنگام استفاده و ایجاد مشکلاتی نطیر آن است.

امّا مسئله‌ای که شاید مهمترین چالش برای کاربران ایرانی در هنگام استفاده از سرویس گوگل کولب باشد، آپلود داده‌های حجیم برای کار کردن روی آن‌ها باشد. گوگل کولب برای کار با داده‌ها از محیط «گوگل درایو» استفاده می‌کند. در واقع داده‌ها روی گوگل درایو آپلود می‌شوند و سپس با احراز هویتی که در محیط گوگل کولب صورت می‌گیرد، راه ارتباط با گوگل درایو را هموار می‌سازد و بعد از این مرحله هیچ فرقی با سیستم شخصی شما نداشته و انگار داده‌ها را در جایی از کامپیوتر خود ذخیره نموده‌اید و با مشخص کردن مسیر داده‌ها، به آن‌ها از طریق کد دسترسی پیدا می‌کنید. با توجه به وضعیت تحریم از سوی گوگل و سرعت نه چندان مناسب اینترنت در کشور، آپلود داده‌هایی با حجم بزرگ ( توجه داشته باشید که مجموعه داده‌های مورد استفاده برای کار در حوزه هوش مصنوعی بایستی به حد کافی بزرگ باشند تا بتوان روی آن‌ها آموزش مناسب داده شود)، یک مشکل اساسی به شمار می‌رود.

بنابراین چنانچه قصد استفاده از این سرویس را دارید، به هر نحوی که شده بایستی مشکلات آن را تا حد امکان برطرف سازید. ما نیز در اینجا فرض را بر این گذاشته‌ایم که شما داده‌های خود را آپلود شده در گوگل درایو در اختیار داشته و در این نوشته تنها شیوه برقراری ارتباط بین گوگل کولب و گوگل درایو مورد بحث است.

مراحل ایجاد یک نوت‌بوک و کار کردن با آن

ابتدا مطمئن شوید به حساب جی‌میل خود متصل هستید و سپس به گوگل درایو مرتبط با حساب جی‌میل خود بروید. توجه داشته باشید که در تمام طول کار، بایستی وی‌پی‌ان یا فیلترشکن روشن باشد. در محیط گوگل درایو، یک پوشه برای تمرین اول اختصاص دهید تا داده‌هایی را که بروی درایو خود آپلود کرده‌اید، داخل آن پوشه قرار دهید. بنابراین بایستی دو پوشه جداگانه train و test در داخل پوشه‌ای که ایجاد کرده‌اید وجود داشته باشند. در داخل فولدر ایجاد شده طبق آنچه در شکل زیر می‌بینید با راست کلیک روی صفحه یک نوت‌بوک کولب را ایجاد کنید.

ایجاد یک نوت‌بوک در محیط گوگل کولب

 

بعد از ایجاد آن، صفحه‌ای باز خواهد شد. قبل از اینکه سراغ کدنویسی داخل آن بروید، بایستی تنظیمات استفاده از «جی‌پی‌یو» را در نوت‌بوک فعال نمایید. در زیر مراحل این تنظیمات مشخص شده است :

 

انتحاب جی‌پی‌یو در محیط گوگل کولب

 

ذخیره انتخاب جی‌پی‌یو

 

بعد از اینکه گزینه Save را انتخاب کردید، می توانید از دکمه سمت راست موجود در نوت‌بوک برای متصل شدن به نوت‌بوک استفاده نمایید.

نوت‌بوک گوگل کولب همانند ژوپیتر نوت‌بوک، سلول‌ها یا خانه‌هایی دارد که می‌توان داخل آن‌ها کدنویسی کرد. اگر از طریق ماوس خود به قسمت پایین هر سلول بروید، گزینه اضافه کردن سلول جدید نیز ظاهر خواهد شد.

  • به طور کلی در تمام استفاده‌های خود با گوگل کولب، بهتر است سلول‌های اولیه را به نصب پکیج‌های لازم در طول برنامه‌تان اختصاص دهید. بدیهی است که در حین کدنویسی و مواجه شدن با شرایط مختلف نصب، یک سری پکیج خاص مورد نیاز خواهد بود؛ امّا توصیه می‌شود بعد از آنکه کلیات برنامه‌تان در دفعات ابتدایی مشخص شد و پکیج‌های لازم تشخیص داده شد، همه آن‌ها را به سلول‌های ابتدایی انتقال دهید و در آنجا نگه دارید تا در دفعات بعدی که نوت‌بوک را باز کردید و قصد کار کردن با آن را داشتید، بدون دردسر پکیج های مورد نیاز را نصب و سپس شروع به ادامه کار کنید تا هربار با خطا های متعدد روبرو نشوید.

پکیج هایی که در این تمرین و داخل فایل‌های کنار فایل اصلی  تشخیص داده شده به صورت زیر بوده و کد مربوط به نصب این پکیج‌ها نیز مشاهده می‌شود:

 

این سه پکیج که در تصویر مشاهده می‌کنید در بخش‌های گوناگون کدهای مربوط به تمرین اول مورد استفاده فرار گرفته‌اند. بقیه پکیج‌ها در گوگل کولب به صورت پیش‌فرض نصب هستند. بعد از وارد کردن این سه خط کد، دکمه اجرا (دکمه با نماد مثلث) واقع در سمت چپ سلول را بزنید تا کدها اجرا شوند.

نصب کتابخانه پای‌تورچ

چون کد‌های تمرین اول به وسیله کتابخانه «پای‌تورچ» نوشته شده‌اند، این کتابخانه نیز بایستی روی نوت‌بوک نصب شود.

 

نصب کتابخانه‌ها در محیط گوگل کولب

 

نصب پای‌تورچ در محیط گوگل کولب

 

 

همان‌گونه که می‌بینید در دو سلول جداگانه، این کتابخانه نصب شده است. امّا هنگام نصب کتابخانه «تورچ ویژن»، همانطور که در شکل نیز نشان داده شده است، پکیج pillow نسخه ۵ نیز نصب می‌شود. آن‌طور که بنده طبق تجربه مشاهده کردم، این بود که گوگل کولب با نسخه ۵ این پکیج مشکل دارد و نسخه سازگار نسخه ۴ این پکیج است. بنابراین بعد از نصب پای‌تورچ ضروری است که نسخه ۴ پکیج pillow را نیز نصب نمایید.

 

 

در این مرحله، نصب پکیج‌های مورد نیاز به پایان رسیده است.

کتابخانه‌های جانبی

بعد از این مرحله، می‌رسیم به آپلود کردن یک سری فایل مورد نیاز کنار فایل اصلی که در اختیار داریم. همانطور که تا به حال می‌دانید، در تمرین اول تعدادی فایل پایتون داده شده‌اند که داخل آن‌ها یک سری توابع تعریف شده و به صورت ماژول‌های آماده درست مثل پکیج‌های نصب شده در قسمت قبلی، در اختیار قرار دارند تا بتوانیم از آن‌ها نیز بهره ببریم. استفاده از آن‌ها می‌تواند به دو صورت ممکن شود. یکی اینکه درست مثل لپ‌تاپ شخصی آن‌ها را در مسیر دایرکتوری قرار دهیم که در اینجا همان گذاشتن آن‌ها در گوگل درایو، داخل پوشه‌ای که درست کردیم و دیگری که به نظر راه بهتر و راحت‌تری نیز هست، آپلود کردن مستقیم آن‌ها داخل نوت‌بوک و استفاده کردن از آن‌ها می‌باشد. در واقع روشی که گفته شد، بیشتر زمانی‌که داده‌های نه چندان بزرگی داریم و می‌‌خواهیم به آن‌ها دسترسی داشته باشیم، مورد استفاده قرار می‌گیرد. توجه داشته باشید که از این روش تنها برای کاربردهای سریع و بلافاصله‌ای استفاده کنید؛ زیرا همانطور که گفته شد بعد از اینکه ماشین مجازی جدید اجرا شد، بایستی دوباره آن‌ها را آپلود کنید. بنابراین برای مثال آپلود مجموعه داده‌ای که حجم بزرگی دارد اولا امکان‌پذیر نبوده و حتی با فرض امکان‌پذیر بودن آن بایستی هر بار با اجرای تازه نوت‌بوک مجدداً آن را آپلود کنید.

 

 

بعد از اجرای سلول بالایی، دکمه Choose File روشن شده و می‌توانید هر تعداد فایل آپلود کنید. این فایل‌ها در خود نوت‌بوک ذخیره می‌شوند. بعد از انجام آن، برای مشاهده لیست فایل های موجود در نوت‌بوک با دستور ls!، می‌توانید آنچه را که آپلود کرده‌اید ببینید.

توجه: با توجه به اینکه در فایل‌های data_utils.py و train.py، تغییراتی اعمال خواهد شد، بنابراین بهتر است موقتاً آن‌ها را آپلود نکنید و بعد از انجام تغییرات دوباره به همین سلول برگشته و آن را اجرا کرده و تنها این دو فایل را آپلود کنید.

استفاده از مجموعه داده‌ها

مرحله بعدی که بسیار مهم نیز هست، ایجاد ارتباط بین گوگل کولب و گوگل درایو برای امکان دسترسی به داده‌های مورد نیاز می‌باشد. طبق اسناد موجود دو روش کلی برای این کار وجود دارد که ما در اینجا به یکی از آن‌ها یعنی بهره‌گیری از «درایو فیوز»، اشاره می‌کنیم.

 

 

در این قسمت پکیج‌های مورد نیاز درایو فیوز نصب می‌شوند. در دو قسمت بعدی که در زیر مشاهده می‌کنید، احراز هویت با حساب کاربری جی‌میل شما صورت می‌گیرد. بدین صورت که با اجرای آن‌ها یک لینک قابل کلیک مشاهده خواهد شد. با زدن روی آن‌ها صفحه‌ای باز می‌شود که اجازه دسترسی را از شما می‌پرسد. درصورت صدور اجازه از طرف شما، یک کد به صورت رشته‌ طولانی تولید می‌شود که بایستی آن را کپی کرده و در نوت‌بوک و زیر آن لینکی که کلیک کرده‌اید، در قاب مشخص شده کپی نموده و Enter را بزنید. این کار را دو بار در هریک از سلول‌های زیر انجام خواهید داد.

 

 

با انجام این سه مرحله ارتباط شما با گوگل درایو صورت می‌پذیرد. برای حصول اطمینان می‌توانید لیست فایل‌ها و پوشه‌های موجود در مسیر مشخص شده توسط خود را مشاهده کنید. توجه داشته باشید که مسیر root در درایو با drive/ مشخص می‌شود و پوشه‌های بعدی، پس از آن نوشته می‌شود. برای نمونه، پوشه PlantSeedling به صورت drive/PlantSeedling/ مشخص می‌گردد.

 

 

ایجاد مجموعه اعتبارسنجی

یکی از کار‌هایی که حتما بایستی انجام بگیرد، تخصیص بخشی از داده‌های آموزشی به عنوان داده‌های اعتبار‌سنجی است. برای این کار تابع create_validation_data در داخل فایل data_utils.py نوشته شده است. با اجرای این تابع، در مسیری که با عنوان val_dir دومین آرگومان ورودی تابع است، فولدری با آن نام در صورت عدم وجود آن ( می‌توانید در گوگل درایو به صورت دستی فولدر valid را درست کنید یا اینکه تابع خود در قسمت os.mkdir(val_dir) این کار را انجام دهد) ایجاد می‌شود.

 

 

 

2 ديدگاه

  1. کیهان گفت:

    اگه وصل بشه گوگل کلوب خیلی عالیه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

3 × چهار =