binary classification 예제


위에서 언급했듯이 비행 지연의 일반적인 회귀 문제를 이진 분류로 변환했습니다: 15분 이하의 비행 지연 예측. AzureML 갤러리의 이진 분류-비행 지연 예측 실험을 기반으로 하며 Microsoft 가상 아카데미 코스의 주요 데모였으며 자세한 내용은 여기를 참조하십시오. 프로세스에 대해, 나는 네트워크가 전체 교육 데이터에 자신을 훈련 것 같아요. 그런 다음, 네트워크는 훈련 데이터 세트(10배 CV)의 임의로 섞인 10개 조각에 대해 검증될 수 있다. 내가 맞지? 그런 다음 모델의 분류 성능과 표준 편차의 정확도 점수를 얻습니까? 또 다른 주요 방법은 일대일 방법입니다. 이 메서드는 M(M − 1)/2 분류기를 구성하며, 여기서 각 분류자는 두 클래스의 데이터에 대해 학습됩니다. ith 및 jth 클래스의 학습 데이터의 경우 다음과 같은 이진 분류 문제가 해결됩니다: 부스팅의 분류 함수 F(x)는 그림 1.5(b):위에서 설명한 바와 같이 1대 1과 1대 1의 가산 형태를 취합니다. 접근 방식에는 장단점이 있습니다. 다중 클래스 분류 문제를 직접 해결하는 방법은 27장과 28장에 소개될 것입니다. 그러나 다중 클래스 분류 문제는 일반적으로 이진 분류 문제보다 더 복잡하기 때문에 직접 메서드가 반드시 감소 접근 방식보다 더 잘 수행되는 것은 아닙니다. 실제로 대상 문제 및 기타 제약 조건에 따라 최상의 방법을 선택해야 합니다. 당신이 대답 주셔서 감사합니다 제이슨, 나는이 예에 대한 또 다른 질문이 있습니다. 섹션 4.1에서와 같이 네트워크를 작게 만든 후 축소된 기능을 어떻게 알 수 있습니까? 숨겨진 레이어의 기능을 60개에서 30으로 줄여야 했습니다.

이 단계 이후에 어떤 기능이 선택되는지 어떻게 알 수 있습니까? 또한 각 기능이 분류 프로세스에 참여한 가중치를 알 수 있습니까? 오류 수정 코드는 각 클래스에 할당되며 각 코드는 비트 벡터입니다. 그림 9.16은 클래스 C1, C2, C3 및 C4에 할당된 7비트 코드워드의 예를 보여 준다. 각 비트 위치에 대해 하나의 분류자 교육을 합니다. 따라서 이 예제에서는 7개의 분류자를 교육합니다. 분류자가 오류를 발생시키는 경우 추가 비트를 통해 얻은 중복성 으로 인해 지정된 알 수 없는 튜플에 대해 올바른 클래스를 예측할 수 있는 가능성이 더 큽니까?

Contact Info

Citizens for Yarbrough

1001 S. 17th Ave

Maywood, IL

Phone : (708) 344-7062

Email :