windowed aggregation에 대하여

Tensorflow TFX에 대하여 공부하던 도중 다음과 같은 issue를 발견하였다.

sliding window

내용의 전체는 아니나 부분적으로 time-window aggregation기능을 원한다는 것이다. time-window라는 단어를 배운 기억은 없지만 streaming data 오픈소스인 카프카의 문서를 보면 일정 시간 간격동안의 간격을 window라고 하며 이를 sliding한다는 것은 해당 간격을 유지하면서 이동한다는 것임을 알 수 있다. 

sliding window on Apache Beam

위의 sliding window 기능이 tensorflow tfx에 구현이 되어 있지 않으나 apache beam에 비슷한 내용이 있기 때문에 이를 통해 예제를 구현한다고 한다.
다음 링크에 보면 sliding window 클래스가 구현되어 있음을 알 수 있다. 

아직 아파치 빔을 사용해본 경험이 없으니 다음 내용은 아파치 빔을 사용하고 업데이트 할 예정.

댓글

이 블로그의 인기 게시물

고려대학교 야간대학원 중간 후기

포켓몬 고 17셀 확인 포고맵 사용 방법

HTTP 오류 500.19 - Internal Server Error 에러 처리법