
مرحله 6:مجموعه داده های جدید مشتق شده
این مرحله نهایی در آنالیز اجزای اصلی است و هم چنین آسان ترین قسمت است وقتی که ما جزای اصلی را انتخاب می کنیم (بردار های مشخصه). ما می خواهیم داده هایمان را حفظ و به شکل یک بردار ویژگی نشان دهیم و ما به سادگی ترانهاده بردار را به دست آورده و این را در سمت چپ ترانهاده مجموعه داده های اصلی ضرب می کنیم.
FinalData = RowFeatureVectore × RowDataAdjust
RowFeatureVectore (بردار ویژگی سطری) ترانهاده ماتریس ستونی از بردار های مشخصه هست، پس یک ماتریس سطری از بردار های مشخصه است. که در آن بردار های مشخصه پر اهمیت تر در بالا قرار دارند.
و RowDataAdjust (داده های تعدیل شده سطری) ترانهاده اطلاعات تعدیل شده است. در هر ستون از مجموعه داده ها قرار دارد و هر سطر یک بعد جداگانه را نگهدار می کند.
FinalData مجموعه داده های نهایی با مجموع داده ها در ستون ها و همراه ابعاد سطرها است. این چه چیزی به ما می دهد؟ منحصرا داده های اصلی را به ازای بردار های اصلی به ما خواهد داد.
مجموعه داده های اصلی ما دو محور دارد(X,Y). بنا بر این داده های ما به ازای آن ها هستند. ممکن است شما دوست داشته باشید که اطلاعات اصلی را به ازای هر دو محور بیان کنید. اگر چه این محورها بر هم عمود هستند ولی این بیان بسیار موثر است. به این دلیل مهم است که بردار های مشخصه همیشه قائم بر یکدیگر هستند. ما به ازای محور های X,Yفرم اطلاعات مان را تغییر داده ایم. حال آن ها به ازای 2 بردار مشخصه ما هستند.
مجموعه داده های جدید وقتی که تعداد ابعاد را کاهش می دهد، در حقیقت دارد بعضی از بردار های مشخصه را حذف می کند مجموعه داده های جدید فقط به ازای بردار های هستند که ما قصد نگهداری آن ها را داریم. برای نشان دادن این امر بر روی داده هایمان، من از تغییر شکل پایانی هر یک از بردار های ویژگی ممکن استفاده کرده ایم.
در مورد حفظ بردار های مشخصه برای تبدیل، ما داده های به دست آمده و الگو پیدا شده را در شکل بعدی می بینیم.
این الگو اساسا طرحی از داده های اصلی است که به این منظور چرخیده که بردار های مشخصه محور ها هستند. این طرح قابل فهم است از وقتی که ما هیچ اطلاعاتی را در این آنالیز از دست نداده ایم.
در شکل داده های نهایی و رسم آن با استفاده از هر دو بردار مشخصه را نشان می دهد:


ما تبدیل دیگری را می توانیم فقط با گرفتن بردار مشخصه با بزرگ ترین مقدار به دست آوریم. جدولی از اطلاعات منتجه شده در شکل بعدی تشکیل شده است. انتظار می رود فقط یک تک بعد باشد. اگر یان مجموعه داده ها را با شکل نتایج استفاده شده از هر دو بردار مشخصه مقایسه کنیم متوجه خواهیم شد که این مجموعه داده دقیقا ستون اول مجموعه داده قبلی است. بنا بر این اگر این مجموعه داده را رسم کنیم چون داده ها یک بعدی هستند دقیقا موقعیت نقاط محور Xدر شکل قبلی است. ما تمام محور دیگر را کنار گذاشته ایم که مربوط به بردار مشخصه دیگر است.

3-1-1 به دست آوردن داده های اصلی(باز گردانی داده های قبلی)
مایل به دست آوردن داده های اصلی هستیم ، این بسیار مهم است اگر شما از تبدیل آنالیز اجزا اصلی برای فشرده سازی داده ها استفاده می کنید.
بنا بر این ما چگونه داده های اصلی را به دست آوریم؟ از قبل ما چه کاری انجام می دهیم، به خاطر می آوریم که اگر ما تمام بردار های مشخصه را در تبدیل مان به کار ببریم دقیقا اطلاعات اصلی را به دست می آوریم، اما اگر ما تعدادی از بردار های مشخصه را در تبدیل نهایی حذف کنیم سپس برای به دست آوردن داده ها، مقداری از اطلاعات را از دست می دهیم(مثلا یکی از کاربرد های این قسمت استفاده در فشرده سازی تصاویر است).
به خاطر داریم که تبدیل نهایی به صورت زیر بود:
FinalData = RowFeatureVectore × RowDataAdjust
که می توان به منظور به دست آوردن داده های اصلی به صورت زیر نوشته شود:
RowDataAdjust = RowFeatureVectore-1 × FinalData
که RowFeatureVectore-1 معکوس RowFeatureVectore است. با وجود این، زمانی که از همه بردار های مشخصه برای به دست آوردن بردار ویژگی استفاده می کنیم، معکوس کردن بردار ویژگی در حقیقت مساوی با ترانهاده آن است. این درست است زیرا عناصر ماتریس ها بردار های مشخصه مجموعه داده هایمان هستند. این باعث می شود بازگشت آسان به مجموعه داده هایمان می شود زیرا معادله را می توان به صورت زیر باز نویسی کرد:
RowDataAdjust = RowFeatureVectoreT × FinalData
این فرمول هم چنین می توان به کار برد زمانی که شما همه بردار های مشخصه را برای به دست آوردن بردار ویژگی استفاده نمی کنید، بنا بر این حتی وقتی شما بعضی از مقادیر ویژه را کنار گذاشته اید معادله بالا هنوز تبدیل را به درستی انجام می دهد.
اما برای به دست آوردن داده های اصلی ما نیاز به اضافه کردن میانگین داده های اصلی (به یاد داریم که در ابتدا آن را کم کردیم) داریم. پس برای کامل شدن داریم:
RowDataAdjust = (RowFeatureVectoreT × FinalData) + OrigonalMean
ما در این جا از باز آفرینی اطلاعات برای بردار ویژگی که از هر دو بردار مشخصه استفاده می کند انجام نمی دهیم زیرا نتیجه دقیقا همان اطلاعاتی است که با آن شروع کردیم خواهد بود. ما از بردار ویژگی کوچکتر استفاده خواهیم کرد تا چگونگی کنار گذاشتن اطلاعات را نشان بدهیم. این طرح در شکل زیر نشان داده شده:

این را با داده های اصلی مقایسه کنید، شما به این نکته توجه خواهید کرد، به چگونگی این که طول بردار مشخصه اصلی محفوظ مانده است، و جزء دیگر تغییر طول دارد(بردار مشخصه که کنار گذاشته ایم).