EN

راهبرد داده کاوی در ارائه محصولات فروشگاهی به کمک بانک اطلاعاتی دشت

نویسنده: نرگس نداف زاده
[تعداد: 22    میانگین: 4.6/5]

از گذشته، کسبه بازار توجه بسیاری به تصمیم گیری در رابطه با خرید تعداد و نوع کالای مورد نیاز مردم داشته اند و با توجه به تجربه و شناخت بازار محصولات پرفروش را برای خرید انتخاب می کردند. ولی امروزه باتوجه به گستردگی اجناس، توسعه شهرها، حجم وسیع داده های موجود و بی تجربه بودن کسبه نوپا، تحلیل بازار و استخراج کالاهای مورد نیاز بازار با سیستم های کامپیوتری که توانایی تصمیم گیری نزدیک به تصمیم گیری های انسانی را دارا هستند مورد توجه قرار گرفته است. این استقبال به دلیل سهولت استفاده و عدم نیاز به تجربه چندین ساله به وجود آمده است.به زبان ساده تر می توان گفت، داده های زیادی موجود است ولی دانش (دانش تصمیم گیری و تصمیم سازی) وجود ندارد. دانش تصمیم گیری و تصمیم سازی با استفاده از داده کاوی (Data Mining) بدست می آید.

داده کاوی چیست؟

علم داده کاوی عبارت است از استخراج اطلاعات و دانش و کشف الگوی پنهان از پایگاه داده های بسیار بزرگ

درحال حاضر داده کاوی مهمترین فن آوری جهت بهره برداری موثر از داده های حجیم است و اهمیت آن رو به افزونی است. تخمین زده می شود که مقدار داده ها در جهان هر ۲۰ ماه تقریبا دو برابر شود. در یک تحقیق که برروی گروه های تجاری بسیار بزرگ در جمع آوری داده ها صورت گرفت، مشخص شد که ۱۹ درصد از این گروه ها داری پایگاه داده هایی با سطح بیشتر از ۵۰ گیگابایت می باشند و ۵۹ درصد آنها انتظار دارند که در آینده نزدیک در این سطح قرار بگیرند.

در صنایعی مانند کارت های اعتباری، ارتباطات، فروشگاه های زنجیره ای، خرید های الکترونیکی، اسکنرهای بارکد خوان، هر روزه داده های زیادی تولید و ذخیره می شوند و افزایش سرعت کامپیوترها باعث به وجود آمدن الگوریتم هایی شده است که قدرت تجزیه و تحلیل بسیار بالایی دارند بدون اینکه محدودیتی در زمینه ظرفیت و سرعت کامپیوترها داشته باشند. (Knowledge Discovery in Database – KDD)

داده کاوی کمک می کند تا سازمان های (هرنوع سازمانی اعم از سازمان های دولتی، فروشگاه ها، بانک ها و …) با کاوش بروی داده های یک سیستم، الگوهای و رفتارهای آینده را کشف و پیش بینی کنند تا مدیران و ذینفعان بتوانند تصمیم گیری های بهتری انجام دهند. داده کاوی با استفاده از تحلیل وقایع گذشته، رفتار آینده سیستم یا مشتری را پیش بینی می کند و به سوالاتی جواب می دهد که پاسخ آنها در گذشته ممکن نبوده و یا به زمان زیادی نیاز داشته است.


مراحل داده کاوی:

به منظور داده کاوی از ابتدا تا انتها مراحل زیر باید طی شود:

  1. جمع آوری داده های ثبت شده
  2. پیش پردازی داده و تبدیل به داده های قابل پردازش: در این مرحله داده های جمع آوری شده به داده های تمیز و قابل پردازش می شوند. این مرحله ممکن است تا ۶۰ درصد زمان داده کاوی را دربر بگیرد.
  3. مشخص کردن ویژگی هایی که میخواهیم بر اساس این ویژگی ها داده کاوی انجام شود (برای مثال: چه محصولاتی با هم فروش رفته اند یا تنوع کدام محصول را بیشتر کنیم و ویژگی هایی از این قبیل)
  4. اجرای عملیات داده کاوی و جستجو برای یافتن الگوی مناسب
  5. تفسیر نتایج داده ها استخراج نتیجه تحلیل

 


برخی از کاربردهای داده کاوی:

  • خرده فروشی: از کاربردهای رایج داده کاوی، استفاده از آن در خرده فروشی است که می توان به موارد زیر اشاه کرد
    • تعیین الگوهای خرید مشتریان
    • تجزیه و تحلیل سبد خرید بازار
    • پیشگویی میزان خرید مشتریان از طریق پست (فروش اینترنتی)
  • بانکداری:
    • پیش بینی الگوهای کلاه برداری از طریق کارت های اعتباری
    • تشخیص مشتریان ثابت
    • تعیین میزان استفاده از کارت های اعتباری بر اساس گروه های اجتماعی
  • بیمه:
    • تجزیه و تحلیل دعاوی
    • پیشگویی میزان خرید بیمه نامه های جدید توسط مشتریان
  • پزشکی:
    • تعیین نوع رفتار با بیماران و پیشگویی موفقیت اعمال جراجی
    • تعیین میزان موفقیت روش های درمانی در برخورد با بیماری های سخت

 


داده کاوی با استفاده از نرم افزار دشت

تحلیل داده های یک فروشگاه که از نرم افزار دشت استفاده می کند:

پیشرفت تکنولوژی، فروشگاه های خرده فروشی را قادر ساخته است که حجم زیادی از داده های مربوط به خرید هریک از مشتریان را که آن را با نام “سبد کالا” یا “فاکتور خرید” می شناسیم، جمع آوری و ذخیره کنند. داده های موجود در سبد کالا نشان دهنده خرید هر مشتری در یک زمان خاص است. هر مشتری خریدهای مجزایی در کمیّت ها و زمان های متفاوتی انجام می دهد. با تجزیه و تحلیل سبد کالا، بینشی برای خرده فروشان بوجود می آید که مشخص می شود چه کالاهایی با هم خریداری شده اند و با این اطلاعات می توان رفتار مشتریان را در خرید کالا پیش بینی کرد و این فرایند به مدیر فروشگاه در تهیه، سازماندهی و چیدمان کالاها در فروشگاه کمک می کند.

بعد از بیان تعاریف کلی در بخش های قبلی، در این بخش به بررسی و تحلیل یک فروشگاه نمونه که از نرم افزار فروشگاهی دشت استفاده می کند می پردازیم و با یک نمونه کاربردی نشان می دهیم که چگونه می توان با تحلیل فاکتور خریدهای ثبت شده در رابطه با تامین کالا، طراحی و چیدمان قفسه ها و ویترین فروشگاه تصمیم گیری کنیم.

۱) جمع آوری داده ها:

بعد از توافقی که با فروشگاه موردنظر صورت گرفت، درحدود ۱۷۰۰۰ فاکتورِ ثبت شده، شامل ۳۵۰۰۰ کالای خریداری شده از پایگاه داده فروشگاه در اختیار قرار گرفت (به جهت توافق عدم افشای اطلاعات مشتری، در جداول زیر نام کالا حذف شده و بجای آن از کد کالا استفاده شده است). هر ردیف از داده ها که حاوی یک تراکنش است، شامل شش ستون به شرح زیر است:

ستون اول: شماره فاکتور ، ستون دوم: تاریخ، ستون سوم: کد کالا، ستون چهارم نام کالا، ستون پنجم: قیمت هر واحد، ستون ششم: تعداد، ستون هفتم: قیمت کل.

اسکریپت SQL جهت استخراج این گزارش در زیر آمده است:


SELECT [POS].[SaleInvoice].[SaleInvoiceID] AS [شماره فاکتور],
[POS].[SaleInvoice].[Date] AS [تاریخ],
[POS].[Item].[ItemID] AS [کد کالا],
[POS].[Item].[Title] AS [نام کالا],
[POS].[SaleInvoiceItem].[Fee] AS [قیمت واحد],
[POS].[SaleInvoiceItem].[Quantity] AS [تعداد],
[POS].[SaleInvoiceItem].[Price] AS [قیمت کل]
FROM [POS].[Item] INNER JOIN [POS].[SaleInvoiceItem] ON [POS].[Item].[ItemID] = [POS].[SaleInvoiceItem].[ItemRef]
INNER JOIN [POS].[SaleInvoice] ON [POS].[SaleInvoiceItem].[SaleInvoiceRef] = [POS].[SaleInvoice].[SaleInvoiceID]
WHERE [POS].[SaleInvoiceItem].[Quantity] > 0 AND
[POS].[SaleInvoiceItem].[SaleInvoiceRef]
IN (SELECT [CountRef].[SaleInvoiceRef] AS [FactorID]
FROM [POS].[SaleInvoiceItem] AS [CountRef]
WHERE [CountRef].[Quantity] > 0
GROUP BY [CountRef].[SaleInvoiceRef]
HAVING Count([CountRef].[SaleInvoiceRef]) > 1)

 

۲) آماده سازی داده ها:

در ابتدا، داده های جمع آوری شده از بانک اطلاعات فروشگاه را در نرم افزار اکسل وارد می کنیم. بعد از بررسی، فاکتورهای دارای فیلدهای خالی و فاکتورهای شامل تنها یک قلم کالا را حذف می کنیم (البته این پاک سازی در اسکریپت SQL درنظر گرفته شده است).  بعد از این پاک سازی تعداد ۹۳۰۲ فاکتور شامل ۲۶۲۶۴ قلم کالای خریداری شده باقی مانده است. (اسکریپت قسمت قبل بخشی از این فیلترینگ را انجام می دهد.)

در مرحله بعدی آماده سازی، جهت مشخص شدن کالاهایی که با یکدیگر در یک فاکتور خریداری شده اند و با فرض اینکه هر فاکتور شماره مخصوص خود را دارد، (شماره فاکتور تکرار پذیر نباشد)، سطرهای فایل اکسل را براساس شماره فاکتور مرتب می کنیم. در این مرحله مشخص می شود که چه کالا هایی با کالای دیگر خریداری شده است.

باتوجه به تعداد زیاد کالا های موجود، جهت حذف کالاهایی که تاثیر کمی در تصمیم گیری دارند و بهینه کردن فرایند تصمیم گیری، ابتدا تعداد فروش هر کالا را مشخص می کنیم. در این گزارش سه ستون قرار دارد:

ستون اول: کد کالا، ستون دوم: عنوان کالا، ستون سوم: تعداد فروش و این گزارش را بر اساس تعداد فروش مرتب می کنیم.

اسکریپت استخراج این گزارش را در زیر مشاهده می کنید:


SELECT [POS].[Item].[ItemID] AS [کد کالا],
[POS].[Item].[Title] AS [عنوان کالا],
COUNT([POS].[SaleInvoiceItem].[ItemRef]) AS [تعداد فروش ]
FROM [POS].[SaleInvoiceItem] INNER JOIN [POS].[Item] ON [POS].[Item].[ItemID] = [POS].[SaleInvoiceItem].[ItemRef]
GROUP BY [POS].[Item].[ItemID], [POS].[SaleInvoiceItem].[ItemRef], [POS].[Item].[Title]
ORDER BY COUNT([POS].[SaleInvoiceItem].[ItemRef]) DESC

با توجه به تعدد کالا های فروش رفته (۲۴۰ قلم کالا) و برای سادگی درک مفهوم این الگوریتم، کالاهای با فروش کمتر از ۵۰۰ عدد فروش را حذف می کنیم. (با اسکریپت زیر) :

SELECT [POS].[Item].[ItemID] AS [کد کالا],
[POS].[Item].[Title] AS [عنوان کالا],
COUNT([POS].[SaleInvoiceItem].[ItemRef]) AS [تعداد فروش ]
FROM [POS].[SaleInvoiceItem] INNER JOIN [POS].[Item] ON [POS].[Item].[ItemID] = [POS].[SaleInvoiceItem].[ItemRef]
GROUP BY [POS].[Item].[ItemID], [POS].[SaleInvoiceItem].[ItemRef], [POS].[Item].[Title]
HAVING COUNT([POS].[SaleInvoiceItem].[ItemRef]) > 500
ORDER BY COUNT([POS].[SaleInvoiceItem].[ItemRef]) DESC
کد کالا تعداد فروش
۱۷۰ ۴,۳۲۲
۱۸۰ ۲,۹۳۳
۱۸۴ ۲,۴۸۹
۱۷۲ ۲,۲۶۹
۳۸۷ ۱,۳۱۷
۳۸۶ ۱,۱۵۸
۱۸۲ ۱,۱۵۴
۱۹۹ ۹۵۲
۲۲۷ ۸۱۲
۲۳۹ ۶۵۹
۴۲۲ ۵۹۲
۱۶۹ ۵۸۳
۲۲۴ ۵۵۴

باتوجه به تغییر محدوده محاسباتی ما، می بایست گزارش لیست فاکتورها نیز بر اساس این محدوده تغییر کند. بنابر این با تغییر اسکریپت SQL مرحله اول، به شکل زیر تعداد کالاهای موجود در گزارش از حدود ۳۵۰۰۰ رکورد به حدود ۱۵۰۰۰ رکورد می رسد.

SELECT [POS].[SaleInvoice].[SaleInvoiceID] AS [شماره فاکتور],
[POS].[SaleInvoice].[Date] AS [تاریخ],
[POS].[Item].[ItemID] AS [کد کالا],
[POS].[Item].[Title] AS [نام کالا],
[POS].[SaleInvoiceItem].[Fee] AS [قیمت واحد],
[POS].[SaleInvoiceItem].[Quantity] AS [تعداد],
[POS].[SaleInvoiceItem].[Price] AS [قیمت کل]
FROM [POS].[Item] INNER JOIN [POS].[SaleInvoiceItem] ON [POS].[Item].[ItemID] = [POS].[SaleInvoiceItem].[ItemRef]
INNER JOIN [POS].[SaleInvoice] ON [POS].[SaleInvoiceItem].[SaleInvoiceRef] = [POS].[SaleInvoice].[SaleInvoiceID]
WHERE [POS].[SaleInvoiceItem].[Quantity] > 0 AND
[POS].[SaleInvoiceItem].[SaleInvoiceRef]
IN (SELECT [CountRef].[SaleInvoiceRef] AS [FactorID]
FROM [POS].[SaleInvoiceItem] AS [CountRef]
WHERE [CountRef].[Quantity] > 0
GROUP BY [CountRef].[SaleInvoiceRef]
HAVING Count([CountRef].[SaleInvoiceRef]) > 1)
AND [POS].[Item].[ItemID] IN (SELECT [tmpitem].[ItemID] AS [tmpitemid]
FROM [POS].[SaleInvoiceItem] AS [tmpfactor] INNER JOIN [POS].[Item] AS [tmpitem]
ON [tmpitem].[ItemID] = [tmpfactor].[ItemRef]
GROUP BY [tmpitem].[ItemID]
HAVING COUNT([tmpfactor].[ItemRef]) > 500)

در مرحله بعد “نسبت  هر سبد کالای شامل هر کالای فروش رفته را به کل سبد کالا ها محاسبه می کنیم و نام آن را پشتیبان کالا می گذاریم. تعداد کل سبد کالاها به معنای تعداد کل فاکتورهایی است که در محاسبات ما شرکت می کنند و با استفاده از اسکریپت زیر قابل استخراج است: (برای مثال ما عدد ۸۰۰۹ بدست آمده است)

SELECT COUNT([FactorID]) AS [تعداد فاکتورهای فیلتر شده]
FROM (SELECT [POS].[SaleInvoice].[SaleInvoiceID] AS [FactorID]
FROM [POS].[Item] INNER JOIN [POS].[SaleInvoiceItem] ON [POS].[Item].[ItemID] = [POS].[SaleInvoiceItem].[ItemRef]
INNER JOIN [POS].[SaleInvoice] ON [POS].[SaleInvoiceItem].[SaleInvoiceRef] = [POS].[SaleInvoice].[SaleInvoiceID]
WHERE [POS].[SaleInvoiceItem].[Quantity] > 0 AND
[POS].[SaleInvoiceItem].[SaleInvoiceRef]
IN (SELECT [CountRef].[SaleInvoiceRef] AS [FactorID]
FROM [POS].[SaleInvoiceItem] AS [CountRef]
WHERE [CountRef].[Quantity] > 0
GROUP BY [CountRef].[SaleInvoiceRef]
HAVING Count([CountRef].[SaleInvoiceRef]) > 1)
AND [POS].[Item].[ItemID] IN (SELECT [tmpitem].[ItemID] AS [tmpitemid]
FROM [POS].[SaleInvoiceItem] AS [tmpfactor] INNER JOIN [POS].[Item] AS [tmpitem]
ON [tmpitem].[ItemID] = [tmpfactor].[ItemRef]
GROUP BY [tmpitem].[ItemID]
HAVING COUNT([tmpfactor].[ItemRef]) > 500)
GROUP BY [POS].[SaleInvoice].[SaleInvoiceID]) AS tmpFactorCount

سپس با استفاده از فایل اکسل که نتایج اجرای تمام اسکریپت های خود را در آن قرار داده ایم و باتوجه به کد کالا، تعداد فاکتورهایی که هر کالا در آن فروش رفته است را استخراج و سپس عدد پشتیبان ان را با فرمول زیر بدست می آوریم:

پشتیبان = تعداد فاکتورهای شامل کالای موردنظر / تعداد کل فاکتورها

برای مثال: عدد پشتیبان کالای بستنی قیفی با کد کالای ۳۸۶ برابراست با تعداد فاکتورهای شامل بستنی قیفی (۵۵۶) تقسیم بر تعداد کل فاکتورها(۸۰۰۹) که برابر ۰٫۰۴۸۲ می شود. به همین ترتیب مقدار پشتیبان تمامی کالاهای مورد نظر را استخراج می کنیم و سپس بر اساس مقدار پشتیبان و بصورت نزولی مرتب می کنیم. که نتیجه را در جدول زیر مشاهده می کنید.

کد کالا تعداد فروش تعداد کل فاکتورها تعداد فاکتورهای شامل این کالا مقدار پشتیبان
۱۷۰ ۴,۳۲۲ ۸,۰۰۹ ۳,۵۰۹ ۰٫۴۳۸۱
۱۸۰ ۲,۹۳۳ ۸,۰۰۹ ۲,۳۱۱ ۰٫۲۸۸۶
۱۸۴ ۲,۴۸۹ ۸,۰۰۹ ۱,۹۶۱ ۰٫۲۴۴۸
۱۷۲ ۲,۲۶۹ ۸,۰۰۹ ۱,۹۴۹ ۰٫۲۴۳۴
۱۹۹ ۹۵۲ ۸,۰۰۹ ۹۰۱ ۰٫۱۱۲۵
۱۸۲ ۱,۱۵۴ ۸,۰۰۹ ۸۸۲ ۰٫۱۱۰۱
۳۸۷ ۱,۳۱۷ ۸,۰۰۹ ۷۸۲ ۰٫۰۹۷۶
۲۲۷ ۸۱۲ ۸,۰۰۹ ۶۹۲ ۰٫۰۸۶۴
۲۳۹ ۶۵۹ ۸,۰۰۹ ۵۰۴ ۰٫۰۶۲۹
۲۲۴ ۵۵۴ ۸,۰۰۹ ۴۵۷ ۰٫۰۵۷۱
۳۸۶ ۱,۱۵۸ ۸,۰۰۹ ۳۸۶ ۰٫۰۴۸۲
۱۶۹ ۵۸۳ ۸,۰۰۹ ۳۴۷ ۰٫۰۴۳۳
۴۲۲ ۵۹۲ ۸,۰۰۹ ۳۰۸ ۰٫۰۳۸۵

همانطور که مشاهده می کنید، ترتیب کالاها براساس تعداد فروش و براساس مقدار پشتیبان با یکدیگر متفاوت است و  این به معنای تاثیر فروش یک کالا بر کالای دیگر است.

در مرحله بعد می بایست مشخص کنیم با هرکالا چه کالاهای دیگری به فروش رفته است.  برای مثال تعداد فاکتورهایی که در آنها به همراه کالای کد ۱۷۰، کالای کد ۱۸۰ نیز خریداری شده است برابراست با ۱۴۹۱و این مقادیر را می بایست در این مرحله برای تمامی جفت کالاهایی که با هم خریداری شده اند استخراج کرد. سپس برای تمامی ترکیبات آنها (۱۷۰ با ۱۹۶ و ۱۸۰  و …) این کار را انجام می دهیم و میدانیم که تمامی این کالاها برای ما اهمیت ندارند، به همین دلیل یک مقدار حداقل برای پشتیبان تعیین می کنیم و تمامی فاکتورهایی که کالاهایی با مقداری پشتیبان کمتر از حداقل تعیین شده قرار داردند را حذف می کنیم. در این مثال، مقدار برابر ۰٫۱ قرار می دهیم و مابقی را نادیده می گیریم. در جدول بالا کالاهایی را که در محاسبات شرکت می دهیم با رنگ سبز و کالاهای حذف شده را با رنگ قرمز نمایش می دهیم.

سپس همانطور که مقدار پشتیبان هرکالا را محاسبه کردیم پشتیبان فاکتورهایی که کالای مقدم و تالی همزمان در آنها قرار دارد را محاسبه می کنیم.

کدکالای مقدم کد کالای تالی تعداد فاکتورهای شامل مقدم تعداد فاکتورهای شامل مقدم و تالی تعداد کل فاکتورها مقدار پشتیبان تالی و مقدم
۱۷۰ ۱۸۰ ۳,۵۰۹ ۱۴۹۱ ۸,۰۰۹ ۰٫۱۸۶۲
۱۷۰ ۱۸۴ ۳,۵۰۹ ۶۴۸ ۸,۰۰۹ ۰٫۰۸۰۹
۱۷۰ ۱۷۲ ۳,۵۰۹ ۳۵۶ ۸,۰۰۹ ۰٫۰۴۴۴
۱۷۰ ۱۹۹ ۳,۵۰۹ ۳۹۶ ۸,۰۰۹ ۰٫۰۴۹۴
۱۷۰ ۱۸۲ ۳,۵۰۹ ۴۵۸ ۸,۰۰۹ ۰٫۰۵۷۲
۱۸۰ ۱۸۴ ۲,۳۱۱ ۲۶۶ ۸,۰۰۹ ۰٫۰۳۳۲
۱۸۰ ۱۷۲ ۲,۳۱۱ ۳۶ ۸,۰۰۹ ۰٫۰۰۴۵
۱۸۰ ۱۹۹ ۲,۳۱۱ ۱۹۱ ۸,۰۰۹ ۰٫۰۲۳۸
۱۸۰ ۱۸۲ ۲,۳۱۱ ۶۸ ۸,۰۰۹ ۰٫۰۰۸۵
۱۸۴ ۱۷۲ ۱,۹۶۱ ۸۵۱ ۸,۰۰۹ ۰٫۱۰۶۳
۱۸۴ ۱۹۹ ۱,۹۶۱ ۱۸۹ ۸,۰۰۹ ۰٫۰۲۳۶
۱۸۴ ۱۸۲ ۱,۹۶۱ ۱۳۳ ۸,۰۰۹ ۰٫۰۱۶۶
۱۷۲ ۱۹۹ ۱,۹۴۹ ۳۲۲ ۸,۰۰۹ ۰٫۰۴۰۲
۱۷۲ ۱۸۲ ۱,۹۴۹ ۲۴۲ ۸,۰۰۹ ۰٫۰۳۰۲
۱۹۹ ۱۸۲ ۹۰۱ ۸۶ ۸,۰۰۹ ۰٫۰۱۰۷

در مرحله بعد می بایست مقدار اهمیت یا وابستگی کالای مقدم و تالی را با فرمول زیر محاسبه می کنیم.

مقدار اهمیت (کالای مقدم و کالای تالی) = پشتیبان مقدم و تالی / (پشتیبان تالی * پشتیبان مقدم)

نتیجه را در جدول زیر مشاهده می کنید.

کدکالای مقدم کد کالای تالی مقدار اهمیت
۱۷۰ ۱۸۰ ۱٫۴۷۲۶
۱۷۰ ۱۸۴ ۰٫۷۵۴۲
۱۷۰ ۱۷۲ ۰٫۴۱۶۹
۱۷۰ ۱۹۹ ۰٫۴۶۰۹
۱۷۰ ۱۸۲ ۱٫۱۸۵۲
۱۸۰ ۱۸۴ ۰٫۴۷۰۱
۱۸۰ ۱۷۲ ۰٫۰۶۴۰
۱۸۰ ۱۹۹ ۰٫۳۳۷۵
۱۸۰ ۱۸۲ ۰٫۲۶۷۲
۱۸۴ ۱۷۲ ۱٫۷۸۳۳
۱۸۴ ۱۹۹ ۰٫۳۹۳۶
۱۸۴ ۱۸۲ ۰٫۶۱۵۹
۱۷۲ ۱۹۹ ۰٫۶۷۴۸
۱۷۲ ۱۸۲ ۱٫۱۲۷۵
۱۹۹ ۱۸۲ ۰٫۸۶۶۷

باتوجه به اینکه قبل از محاسبه مقدار اهمیت و جهت کاهش حجم محاسبات، فیلترهای زیادی برروی کالاها و فاکتورها قرار دادیم، مقادیر اهمیت به دست آمده را به دو دسته تقسیم می کنیم:

  • اگر مقدار اهمیت بزرگتر از یک باشد، آنگاه کالای مقدم و تالی با یکدیگر رابطه مثبت دارند، یعنی اگر مشتری کالای مقدم را بخرد با احتمال (۱-مقدار اهمیت) * ۱۰۰ کالای تالی را خواهد خرید. برای مثال اگر مشتری کالای ۱۸۴ را بخرد با احتمال (۱٫۷۸۳۳ – ۱) * ۱۰۰ = ۷۸٫۳۳% کالای ۱۷۲ را خواهد خرید
  • اگر مقدار اهمیت کمتر از یک باشد، آنگاه کالای مقدم و تالی با یکدیگر رابطه منفی دارند، یعنی اگر مشتری کالای مقدم را بخرد با احتمال (مقدار اهمیت) * ۱۰۰ کالای تالی را نخواهد خرید. برای مثال اگر مشتری کالای ۱۹۹ را بخرد با احتمال ۸۶۶۷ * ۱۰۰ = ۸۶٫۶۷% کالای ۱۸۲ را نخواهد خرید.

با استفاده از مراحل فوق به همراه اسکریپت های SQL و اکسل، می توانید با تقریب بسیار خوبی رفتار مشتری را در رابطه با خرید چند قلم کالا پیش بینی کنید و با فیلتر کردن فاکتورهای براساس تاریخ میتوانید رفتارهای فصلی را نیز پیشبینی کنید.

البته همان طور که مشاهده کردید این مقاله تنها خرید دو کالای همزمان را به عنوان نمونه بررسی کرد و جهت بررسی مقدار اهمیت خرید چند کالا به همراه یک کالا، می توانید با استفاده از مراحل مطرح شده ولی با فرایند محاسباتی بیشتر و پیچیده تر سایر رفتارها را نیز پیش بینی کنید.

این مطالب را نیز بخوانید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خبرنامه سپیدار

برای دریافت آخرین فایل های کاربردی و مطالب وبلاگ به خبرنامه سپیدار بپیوندید

شکیبا باشید

از شما متشکریم