کتاب بزرگ داده، معماری و کاربرد

19,000 تومان

این کتاب میتواند بعنوان مرجعی برای آشنایی و درک معماری و عملکرد سخت افزارهای موجود و همچنین الگوهای مورد استفاده در این سخت افزارها بحساب بیاید. دلیل انتخاب این کتاب برای ترجمه نیز همین بوده است. چرا که باید در کنار آشنایی با روش های نرم افزاری بزرگ داده ای با سخت افزارها و معماری های موجود نیز آشنایی داشت. نویسندگان این کتاب از افرادی هستند که سالها در زمینه این سخت افزارها فعالیت داشته و در شرکت های مرتبط و درگیر با امر بزرگ داده نیز در ارتباط بوده اند. به شخصه این کتاب را برای افرادی که علاقه مند به بزرگ داده و موارد مرتبط با آن بخصوص موارد مرتبط با معماری و ساختار سخت افزارهای پشتیبانی کننده بزرگ داده هستند پیشنهاد می کنم این کتاب را از دست ندهند چرا که واقعا کمتر جایی پیدا می شود که درباره این مباحث حتی توضیحی کوتاه ارائه شده باشد.

 

موجود در انبار

توضیحات

Print Friendly, PDF & Email

مقدمه مترجم کتاب:

بزرگ یعنی بزرگ!

در علم کامپیوتر و صنایع وابسته آن ابعاد رنگ و بوی متفاوتی نسبت به دیگر علوم دارند. در علم شیمی ابعاد برعکس دیگر علوم رشد می کنند. روز به روز به سمت ابعاد کوچکتر می رویم. میلی، میکرو، نانو و ریزتر و همگی نشان از پیشرفت بیشتر این علم دارند. بر اساس آنچه در ویکی پدیا درباره داده نوشته شده است: ” به طور کلی، می‌توان همهٔ دانسته‌ها، آگاهی‌ها، داشته‌ها، آمارها، شناسه‌ها، پیشینه‌ها و پنداشته‌ها را داده یا دیتا (به انگلیسی: Data) نامید.” در کامپیوتر داده یکی از مهمترین و شاید اساسی ترین اقلامی است که بر روی آن از مراحل تولید تا مصرف بصورت جدی و با دقت بالا مدیریت صورت می پذیرد. دنیای امروزه شاهد طوفانی از داده های سردرگرم می باشد. یک طوفان بر سر راه خود هرآنچه را می بیند همراه خود می برد و در یک عمر کوتاه می توان انتظار وجود هرچیزی درون آن را داشت. اما چیزهایی که دستخوش تغییرات بوده اند و برای درک دقیق آنها باید اعمال مناسب و خاصی انجام شود. شبکه های اجتماعی، اطلاعات شخصی، محتوای وب سایت ها و وبلاگ ها، جستجوهای موتورهای جستجو، بازخوردهای کاربران، اخبار، و …. همگی داده هایی هستند که می توانند مفید و تاثیرگذار در تصمیم گیری ها و برنامه ریزی ها باشند. فرایند بررسی این داده ها و نتیجه گیری از آنها و درنهایت به نمایش گذاشتن نتایج حاصل شده آن چیزی است که بزرگ داده نامیده می شود. اکثرا حتی در محیط های علمی هم معنای بزرگ داده را فقط در حجم بالای داده ها می بینند درصورتیکه بزرگ داده مفهومی فراتر از حجم داده بوده و به موارد دیگری از جمله سرعت و بار پردازشی بالای این داده های حجیم نیز مربوط می شود. اگر موارد نرم افزاری این سیستم های بزرگ داده ای را کنار بگذاریم، بحث سخت افزار و معماری های مورد استفاده جهت پیاده سازی دستگاه های با این توان و قدرت بالای پردازش و انتقال داده به چشم می آید که این جنبه از سیستم های بزرگ داده ای گاهاً کمتر دیده می شود چرا که اکثر استفاده کنندگان از این سیستم ها فقط با نرم افزارها بطور مستقیم سروکار دارند.

این کتاب میتواند بعنوان مرجعی برای آشنایی و درک معماری و عملکرد سخت افزارهای موجود و همچنین الگوهای مورد استفاده در این سخت افزارها بحساب بیاید. دلیل انتخاب این کتاب برای ترجمه نیز همین بوده است. چرا که باید در کنار آشنایی با روش های نرم افزاری بزرگ داده ای با سخت افزارها و معماری های موجود نیز آشنایی داشت. نویسندگان این کتاب از افرادی هستند که سالها در زمینه این سخت افزارها فعالیت داشته و در شرکت های مرتبط و درگیر با امر بزرگ داده نیز در ارتباط بوده اند. به شخصه این کتاب را برای افرادی که علاقه مند به بزرگ داده و موارد مرتبط با آن بخصوص موارد مرتبط با معماری و ساختار سخت افزارهای پشتیبانی کننده بزرگ داده هستند پیشنهاد می کنم این کتاب را از دست ندهند چرا که واقعا کمتر جایی پیدا می شود که درباره این مباحث حتی توضیحی کوتاه ارائه شده باشد.

 

با آرزوی دنیایی پر از داده های مدیریت شده

محمدامین ساجدی

زمستان 1393

فهرست مطالب این کتاب به شرح زیر می باشد.

———————————————————————————————————

فصل اول: مقدمه بزرگ داده

چرا بزرگ داده؟

تفاوت بزرگ داده با هوش سازمانی

میزان موفقیت

استخراج دیدگاه از داده ها

بزرگ داده های با قابلیت ابری

مقایسه داده های ساخت یافته و بدون ساختار

تحلیل در دنیای بزرگ داده

چالش های بزرگ داده

تعریف یک معماری مرجع

نیاز به الگوهای معماری

خلاصه

فصل دوم : معماری نرم افزاری بزرگ داده

معماری یک راهکار مناسب بزرگ داده ای

منابع داده

لایه فروبری

لایه ذخیره سازی توزیع شده(هادوپ)

لایه زیربنایی هادوپ

لایه مدیریت پلتفرم هادوپ

لایه امنیت

نظارت بر لایه ها

موتور محاسباتی

موتورهای جستجو

موتورهای بلادرنگ

لایه بصریسازی

نرم افزارهای بزرگ داده

خلاصه

فصل سوم: الگوهای فروبری و جریان بزرگ داده

درک فروبری داده

الگوی جداساز چندمنبعی

الگوی مبدل پروتکل

الگوی چند مقصدی

الگوی انتقال در یک زمان

الگوی بلادرنگ جریان

ابزارهای ETL برای بزرگ داده

خلاصه

فصل چهارم: الگوهای ذخیره سازی بزرگ داده

درک ذخیره ساز بزرگ داده

الگوی دریچه

دستگاه های داده ای

دیسک های ذخیره سازی

بایگانی داده ها

بخش بندی داده/ شاخص گذاری و الگوی Lean

جایگزین های HDFS

الگوی NoSQL

الگوی تداوم چندزبانی

زیرساخت ذخیره سازی بزرگ داده

پیکربندی عادی داده-گره

خلاصه

فصل پنجم: الگوهای دستیابی بزرگ داده

درک دستیابی به بزرگ داده

الگوی تبدیل سطح

الگوی  اتصال دهنده

الگوی دسترسی شبه بلادرنگ

الگوی سیال سبک

الگوی گزینش مانه

آنالیز سریع داده ها

دستیابی ایمن به داده ها

فصل ششم: الگوهای کشف و تحلیل داده

الگوی پرس و جوی داده

الگوی ادراک برپایه شاخص

الگوی جستجوی برجی

الگوی هدایت گر یادگیری ماشین

الگوی همگرا

چالش های موجود در تحلیل بزرگ داده

تحلیل فایل های Log

تحلیل حساسیت

تحلیل داده بعنوان سرویس

خلاصه

فصل هفتم: الگوهای بصریسازی بزرگ داده

مقدمه ای بر بصریسازی بزرگ داده

الگوهای تحلیل بزرگ داده

الگوی دید ترکیبی

الگوی فشرده سازی

الگوی ناحیه بندی

الگوی دید لحظه ای

الگوی انفجاری

الگوی سردر

الگوی تسهیل خدمات

خلاصه

فصل هشتم: الگوهای گسترش بزرگ داده

زیرساخت بزرگ داده: الگوی معماری هیبرید

الگوی سنتی شبکه درختی

الگوی تعامل منابع برای امنیت و یکپارچگی داده ها

الگوی پوشش ستونی

الگوی فدراسیون

الگوی Lean DevOps

بزرگ داده بر روس معماری ابری و هیبرید

عملیات های بزرگ داده

خلاصه

فصل نهم: نیازمندی های غیرعملیاتی بزرگ داده

نیازمندی ها

امنیت

الگوی اتمام موازی

الگوی انتزاع انواع

الگوی جریان سازی بلادرنگ با استفاده از دستگاه ها

الگوی جستجوی توزیع شده بهینه

هرچیزی بعنوان یک الگوی API

چالش های امنیتی

عملکرد

بازرسی امنیت سیستم های بزرگ داده

محصولات امنیتی بزرگ داده

خلاصه

فصل دهم: مطالعات موردی بزرگ داده

موضوع مورد مطالعه: پردازنده مرکزی پایگاه داده های NoSQL هادوپی

موضوع مورد مطالعه: فراوانی جغرافیایی و فروبری داده ها در محدوده نزدیک به بلادرنگ

موضوع مورد مطالعه: موتور توصیه گر

موضوع مورد مطالعه: تحلیل جریان ویدئو

موضوع مورد مطالعه: تحلیل حساسیت و پردازش لاگ ها

موضوع مورد مطالعه: رهگیری بلادرنگ ترافیک

موضوع مورد مطالعه: اکتشاف در داده ها برای تشخیص رفتارهای مشکوک در معاملات بورس

موضوع مورد مطالعه: تشخیص تغییرات زیست محیطی

خلاصه

فصل یازدهم: منابع، مراجع و ابزارها

کاتالوگ محصولات بزرگ داده

توزیع های هادوپ

هادوپ درون حافظه ای

رابط کاربری SQL هادوپ

ابزارهای فروبری

جایگزین های MapReduce

انتخاب های ابری

سیستم های مدیریت پایگاه داده های شبه جدولی

پایگاه داده های NoSQL

سیستم های مدیریت پایگاه داده های درون حافظه ای بزرگ داده

مجموعه داده ها

کشف داده ها

تصویرسازی

ابزارهای تحلیل

ابزارهای یکپارچه سازی داده ها

خلاصه

پیوست: مراجع و کتابشناسی

لغات و اصطلاحات

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

.فقط مشتریانی که این محصول را خریداری کرده اند و وارد سیستم شده اند میتوانند برای این محصول دیدگاه ارسال کنند.