pandas보다 빠르게 데이터 저장하기
pandas보다 데이터를 빠르게 저장하는 법에 대해 간단히 정리한다. pandas를 편해서 사용하다 보니 생각보다 I/O 작업에 시간이 오...
2024/10/07 # ETL duckdb polars pyarrowpandas보다 데이터를 빠르게 저장하는 법에 대해 간단히 정리한다. pandas를 편해서 사용하다 보니 생각보다 I/O 작업에 시간이 오...
2024/10/07 # ETL duckdb polars pyarrowAthena에서 Apache Iceberg 테이블 활용하는 법에 대해 간단히 정리한다. TIME TRAVEL & ROLLBACK ...
2024/09/03 # ETL Athena IcebergAthena에서 Apache Iceberg 테이블 활용하는 법에 대해 간단히 정리한다. Apache Iceberg는 The open tab...
2024/07/31 # ETL Athena IcebergLambda에서 활용가능한 aws-sdk-pandas에 대해 간단히 알아본다. github 주소 : aws-sdk-pandas (panda...
2024/06/20 # ETL LambdaEC2의 EBS 볼륨 사이즈 줄이는 방법에 대해 알아본다. EBS는 축소 불가 EBS는 기본적으로 볼륨 확장은 가능하지만 축소는 불가능하...
2024/05/14 # DevOps EC2 EBSoptional label과 비용효과적인 Protobuf 처리에 대해 알아본다. 이전 상황 센서 데이터를 protobuf로 형식으로 받아...
2024/04/24 # ETL Protobuf Python FirehoseSQL로 PIVOT 테이블 만드는 방법에 대해 간단히 정리해본다. SQL 기준 : ATHENA DuckDB 아래 stackoverflow...
2024/03/06 # SQL Athena DuckDB위경도 좌표 간 거리 계산하는 방법에 대해 간단히 정리해본다. SQL 기준 : ATHENA GEOGRAPHY 타입 GEOGRAPHY는 ...
2024/02/26 # SQL Athena DuckDB특정 Polygon 안에 포함된 위치 데이터 검색 방법에 대해 간단히 정리해본다. SQL 기준 : ATHENA DuckDB GEOMETR...
2024/02/20 # SQL Athena DuckDBN-interval(N시간 간격) 데이터 처리하는 방법에 대해 간단히 정리해본다. 참고: stakoverflow를 보고 배웠으나 기존 링크...
2024/02/19 # SQL Athena DuckDB