Tensorflow Lite Posenet (သို့) Pose ခန့်မှန်းချက်သည်လူတစ် ဦး ၏ပုံရိပ် (သို့) ဗီဒီယိုမှသော့ခန္ဓာကိုယ်အဆစ်များ၏အဓိကနေရာများ (အဓိကအချက်များ) ကိုခန့်မှန်းရန် ML model ကိုအသုံးပြုခြင်း၏တာဝန်ဖြစ်သည်။
Pose ခန့်မှန်းချက်ဆိုသည်မှာလူတစ် ဦး တစ်ယောက်၏တံတောင်ဆစ်ပုံတစ်ပုံတွင်မည်သည့်နေရာ၌ရှိနေသည်ကိုဆုံးဖြတ်ရန်အတွက်ရုပ်ပုံများနှင့်ဗွီဒီယိုများတွင်လူ့ကိန်းဂဏန်းများကိုရှာဖွေသည့်ကွန်ပျူတာရူပါရုံနည်းပညာကိုရည်ညွှန်းသည်။ ခန့်မှန်းတွက်ချက်မှုသည်ခန္ဓာကိုယ်၏အဓိကအဆစ်များမည်သည့်နေရာတွင်ရှိသည်ကိုခန့်မှန်းခြင်းနှင့်ပုံရိပ်တစ်ခုသို့မဟုတ်ဗီဒီယိုတွင်မည်သူမည်ဝါဖြစ်သည်ကိုမသိခြင်းတို့ကိုသတိပြုရန်အရေးကြီးသည်။
PoseNet မော်ဒယ်လ်သည်ရိုက်ကူးထားသောကင်မရာပုံရိပ်ကို input အဖြစ်ယူပြီး keypoints နှင့်ပတ်သက်သောသတင်းအချက်အလက်များကိုထုတ်ပေးသည်။ ရှာဖွေတွေ့ရှိသော keypoints သည် ၀ ဒသမ ၀၀ မှ ၁.၀ အကြားယုံကြည်မှုရမှတ်ဖြင့် ID နံပါတ်တစ်ခုဖြင့်ရည်ညွှန်းသည်။ ယုံကြည်မှုရမှတ်သည်ထိုအနေအထားတွင်အဓိကအချက်တည်ရှိနိုင်သည့်ဖြစ်နိုင်ခြေကိုဖော်ပြသည်။
စွမ်းဆောင်ရည်အခြေခံစံနှုန်းများ
စွမ်းဆောင်ရည်သည်သင်၏စက်ပစ္စည်းနှင့်ထုတ်လုပ်မှုအပြောင်းအလဲအပေါ် မူတည်၍ ကွဲပြားသည် (heatmaps နှင့် offset vectors) ။ PoseNet မော်ဒယ်ဆိုသည်မှာပုံသဏ္sizeာန်အရွယ်အစားလျော့ပါးသွားမည်ဖြစ်သည်၊ ဆိုလိုသည်မှာပုံရိပ်ကိုလျှော့ချခြင်းရှိမရှိမူရင်းပုံနှင့်တူညီသောအတိုင်းအတာတစ်ခုတည်းတွင်ရှိသည်ဟုခန့်မှန်းနိုင်သည်။ ဆိုလိုသည်မှာသင်သည်မော်ဒယ်လ်ကိုစွမ်းဆောင်ရည်၏ကုန်ကျစရိတ်ဖြင့်ပိုမိုမြင့်မားသောတိကျမှုရှိစေရန် configure လုပ်သည်။
output stride သည် input ပုံအရွယ်အစားနှင့်နှိုင်းယှဉ်လျှင် output သည်မည်မျှလျှော့ချသည်ကိုဆုံးဖြတ်သည်။ ၎င်းသည်အလွှာများ၏အရွယ်အစားနှင့်မော်ဒယ်ရလဒ်များအပေါ်သက်ရောက်မှုရှိသည်။
အထွက်တိုးလေလေ၊ ကွန်ယက်အတွင်းရှိအလွှာများ၏ဆုံးဖြတ်ချက်နှင့်အကျိုးရလဒ်များနည်းလေလေဖြစ်သည်။ ဤအကောင်အထည်ဖော်မှုတွင် output stride သည် 8, 16 သို့မဟုတ် 32 ၏တန်ဖိုးများရှိနိုင်သည်။ တစ်နည်းအားဖြင့် output stride ၃၂ သည်အမြန်ဆုံးစွမ်းဆောင်ချက်ကိုရရှိစေပြီးအနိမ့်ဆုံးတိကျမှုသည် ၈ သည်အမြင့်ဆုံးတိကျမှုနှင့်အနှေးကွေးဆုံးစွမ်းဆောင်ရည်ကိုဖြစ်ပေါ်စေသည်။ အကြံပြုထားသောစတင်တန်ဖိုးမှာ ၁၆ ဖြစ်သည်။