ngc_ProfanityFilterBase.h - OpenGrok cross reference for /CTR-SDK-0.14.4/include/nn/ngc/CTR/ngc_ProfanityFilterBase.h

/*---------------------------------------------------------------------------*
  Project:  Horizon
  File:     ngc_IProfanityFilter.h

  Copyright (C)2010 Nintendo Co., Ltd.  All rights reserved.

  These coded instructions, statements, and computer programs contain
  proprietary information of Nintendo of America Inc. and/or Nintendo
  Company Ltd., and are protected by Federal copyright law.  They may
  not be disclosed to third parties or copied or duplicated in any form,
  in whole or in part, without the prior written consent of Nintendo.

  $Rev: 30667 $
 *---------------------------------------------------------------------------*/

#ifndef NN_NGC_CTR_PROFANITY_FILTER_BASE_H_
#define NN_NGC_CTR_PROFANITY_FILTER_BASE_H_

#include <nn/cfg/CTR/cfg_RegionCode.h>

namespace nn
{
namespace ngc
{
namespace CTR
{

/*!
   @brief NGワードフィルタの基底クラスです。

          メモリ消費量と速度のトレードオフで、将来的に異なるバージョンの
          NGワードフィルタがリリースされる可能性があり、このクラスはその基底となります。
 */
class ProfanityFilterBase
{
public:
    /*!
      @brief デストラクタです。
     */
    virtual ~ProfanityFilterBase(){}

    /*!
      @brief 現在本体にインストールされているNGワードパターンファイルのバージョン番号を取得します。
      @return インストールされているバージョン番号が返ります。バージョンは1から始まり、数が大きいほど新しいことを示します。取得に失敗した場合0が返ります。
     */
    virtual u32 GetContentVersion() = 0;

    /*!
      @brief 指定された複数の文字列がスクリーン上に表示される文字列として問題がある語句かどうかを、全てのパターンリストについて確認します。

             この処理は時間がかかる場合があります(ブロックします)。
             ゲームフレーム処理に干渉しないように別のスレッドで行ってください。
             この関数は複数の文字列を同時に確認することができます。
             一度に複数の文字列をチェックすることで、1つずつ個別にチェックするよりも短い時間で調査が終了します。

             各文字列ごとのチェックした結果は、 pCheckResults 配列に格納されます。
             これは、ビットフラグ値になっており、どのパターンセットで問題が発生したかを知ることが出来ます。
             1をProfanityFilterPatternList列挙体の定数値分だけ左シフトした値とANDを取って調べてください。
             なお、全てのパターンリストにおいて問題がない文字列の場合は値が0になります。

             どのパターンリストに対してチェックを行わなければならないという決まりについては、
             最新のUGCガイドラインを参照してください。

             メールアドレスの表記に使われる可能性のあるアットマーク記号が含まれている場合、
             常に問題のある語句として検出されます。ただし、電話番号などの表示に利用される可能性がある、
             数字が多く含まれている文字列については問題のある語句としては検出されません。
             このチェックにはnn::ngc::CTR::CountNumbers関数を用いてください。

      @param [out] pCheckResults    問題があったかどうかの判定を格納するためのバッファを指定します。nWordCountで指定した個数の配列が必要です。
      @param [in]  ppWords          調査対象となるNULL終端文字列の配列を指定します。文字コードはUTF16リトルエンディアンにしてください。
      @param [in]  nWordCount       調査対象の文字列の数を指定します。
     */
    virtual nn::Result CheckProfanityWords( bit32* pCheckResults, const wchar_t** ppWords, size_t nWordCount ) = 0;

    /*!
      @brief 指定された複数の文字列がスクリーン上に表示される文字列として問題ある語句かどうかを、パターンリスト指定されたパターンリストについて確認します。

             この処理は時間がかかる場合があります(ブロックします)。
             ゲームフレーム処理に干渉しないように別のスレッドで行ってください。
             この関数は複数の文字列を同時に確認することができます。
             一度に複数の文字列をチェックすることで、1つずつ個別にチェックするよりも短い時間で調査が終了します。

             各文字列ごとのチェックした結果は、 pCheckResults 配列に格納されます。
             1をnPatternCodeで指定した値で左シフトした値とANDを取って調べてください。
             nPatternCodeで指定したリストについて問題がないと判断された場合は値が0になります。

             どのパターンリストに対してチェックを行わなければならないという決まりについては、
             最新のUGCガイドラインを参照してください。

             メールアドレスの表記に使われる可能性のあるアットマーク記号が含まれている場合、
             常に問題のある語句として検出されます。ただし、電話番号などの表示に利用される可能性がある、
             数字が多く含まれている文字列については問題のある語句としては検出されません。
             このチェックにはnn::ngc::CTR::CountNumbers関数を用いてください。

      @param [out] pCheckResults    問題があったかどうかの判定を格納するためのバッファを指定します。nWordCountで指定した個数の配列が必要です。
      @param [in]  nPatternCode     どのパターンリストに対してチェックを行うのかを指定します。
      @param [in]  ppWords          調査対象となるNULL終端文字列の配列を指定します。文字コードはUTF16リトルエンディアンにしてください。
      @param [in]  nWordCount       調査対象の文字列の数を指定します。
     */
    virtual nn::Result CheckProfanityWords( bit32* pCheckResults, ProfanityFilterPatternList nPatternCode, const wchar_t** ppWords, size_t nWordCount ) = 0;

    /*!
      @brief 指定された複数の文字列がスクリーン上に表示される文字列として問題ある語句かどうかを、
             本体のリージョンおよび言語設定を取得したうえで、UGCガイドラインで指定されたパターンリストについて確認します。

             この処理は時間がかかる場合があります(ブロックします)。
             ゲームフレーム処理に干渉しないように別のスレッドで行ってください。
             この関数は複数の文字列を同時に確認することができます。
             一度に複数の文字列をチェックすることで、1つずつ個別にチェックするよりも短い時間で調査が終了します。

             この関数を実行するためにはcfgライブラリが初期化されている必要があります。
             この関数を実行すると、内部的に現在の本体リージョン及び言語設定を参照し、
             その組み合わせからチェックが必要とされるパターンリストを自動的に選び出してNGワードチェックを行います。

             各文字列ごとのチェックした結果は、 pCheckResults 配列に格納されます。
             これは、ビットフラグ値になっており、どのパターンセットで問題が発生したかを知ることが出来ます。
             1をProfanityFilterPatternList列挙体の定数値分だけ左シフトした値とANDを取って調べてください。
             なお、全てのパターンリストにおいて問題がない文字列の場合は値が0になります。

             メールアドレスの表記に使われる可能性のあるアットマーク記号が含まれている場合、
             常に問題のある語句として検出されます。ただし、電話番号などの表示に利用される可能性がある、
             数字が多く含まれている文字列については問題のある語句としては検出されません。
             このチェックにはnn::ngc::CTR::CountNumbers関数を用いてください。

      @param [out] pCheckResults                    問題があったかどうかの判定を格納するためのバッファを指定します。nWordCountで指定した個数の配列が必要です。
      @param [in]  bCommunicateWithOtherRegions     アプリケーションが他のリージョンとのデータ交換を行うかどうかを指定してください。これによってチェック対象のリストが変わります(現在は参照されません)。
      @param [in]  ppWords                          調査対象となるNULL終端文字列の配列を指定します。文字コードはUTF16リトルエンディアンにしてください。
      @param [in]  nWordCount                       調査対象の文字列の数を指定します。
     */
    virtual nn::Result CheckProfanityWords( bit32* pCheckResults, bool bCommunicateWithOtherRegions, const wchar_t** ppWords, size_t nWordCount ) = 0;

protected:
    void GetPatternListsFromRegion( ProfanityFilterPatternList* pPatternLists, int *pListNum, bool bCommunicateWithOtherRegions );
    void ConvertTargetWord( wchar_t* pConvertedWord, const wchar_t* pWord );
    bool IsIncludesAtSign( const wchar_t* pWord );

private:
    /*!
      @brief カタカナの大きい文字(ア)と小さい文字(ァ)のマッピングです。
     */
    typedef struct SmallMap
    {
        //! 小さい文字(ァ)
        wchar_t small;

        //! 大きい文字(ア)
        wchar_t big;
    } SmallMap;

    /*!
      @brief カタカナの半角文字と全角文字のマッピングです。
     */
    typedef struct HalfwidthMap
    {
        //! 半角文字
        wchar_t half;

        //! 全角文字
        wchar_t full;
    } HalfwidthMap;

    void ConvertKatakanaToBig( wchar_t *pKana );
    bool ConvertHalfwidthKatakanaToFullwidth( wchar_t *pBuffer, wchar_t half, const HalfwidthMap* pMapping, int mapNum );

private:
    static const SmallMap s_SmallMapping[];
    static const HalfwidthMap s_HalfMapping[];
    static const HalfwidthMap s_VoicedMapping[];
    static const HalfwidthMap s_SemiVoicedMapping[];
};

}   // namespace CTR
}   // namespaec ngc
}   // namespace nn

#endif // NN_NGC_CTR_PROFANITY_FILTER_BASE_H_