پیاده سازی الگوریتم Apriori داده کاوی به زبان PHP - متن باز
آپریوری یک الگوریتم کلاسیک برای یادگیری قوانین وابستگی است. آپریوری روی پایگاههای داده شامل تراکنشها (مثلاً مجموعه محصولات خریداری شده توسط مشتریان در یک سوپرمارکت) ساخته شدهاست. الگوریتمهای دیگری نیز در این زمینه وجود دارند که روی پایگاه دادههایی کار میکنند که یا شامل تراکنش نیستند (Winepi و Minepi) و یا دارای ثبت زمانی نیستند (DNA sequencing).
ورودی این الگوریتم مجموعهای از مجموعه آیتمها است. الگوریتم تلاش میکند تا زیرمجموعههایی از آیتمها را که حداقل بین C مجموعه آیتم مشترک است بیابد. آپریوری یک الگوریتم پایین به بالا است، آنگونه که در هر مرحله یک آیتم به زیرمجموعههای مکرر اضافه میشود (تولید کاندید). مجموعه کاندیدها روی داده مورد ارزیابی قرار میگیرند. شرط خاتمه الگوریتم، عدم وجود شیوه توسعه موفق دیگری است. ویکیپدیا
الگوریتم Apriori یکی از روشهای مورد استفاده در علم داده کاوی(Data Mining) و از جمله الگوریتمهای مهم در استخراج قوانین وابستگی است. این الگوریتم به زبانهای مختلفی پیاده سازی شده است اما هیچ کدی از آن برای زبان PHP موجود نیست. بنابراین با توجه به نیاز ما به پیاده سازی الگوریتم به زبان PHP ، اپریوری را به این زبان کدنویسی کردیم. همچنین صلاح دانستیم با اشتراک آن در محیط وب ، پژوهشگران و دانشجویان را از این مورد مطلع تا از آن در پروژه های خود استفاده کنند. هر چند نرم افزارهای داده کاوی مختلفی وجود دارد که این الگوریتم نیز در آنها تعبیه شده است اما گاها پیش می آید تا در برخی موارد آزمایش خود را کدنویسی نموده و مستقلا از این الگوریتم استفاده نماییم. لازم بذکر است که در پیاده سازی از هیچ کد دیگری الهام گرفته نشده بلکه مستقیما از خود الگوریتم کدنویسی شده است.
الگوریتم بصورت یک کلاس در زبان PHP نوشته شده که در نسخه 0.1 بتای خود قرار دارد بنابراین میتوانید از آدرس اصلی و یا از آدرس گیت هاب صفحه گروه ما دریافت نمایید. شایان ذکر است طبق الگوریتم ، کلیه موارد خروجی اعم از آیتمهای تکراری و قوانین انجمنی تعبیه شده است.