본문 바로가기

분류 전체보기65

효과적인 데이터 질의(SQL) reddit 게시글 중에 data analyst 필요 기술 중, SQL 스킬에 대한 강조 차원의 도표를 보면서 데이터 분석을 위한 Database 질의 언어인 SQL(Structured Query Language)을 얘기하려고 한다. 가장 기본적인 언어 프레임은 다음과 같다. SELECT FROM WHERE GROUP BY HAVING ORDER BY 실제로 데이터 질에서 data set가 줄어드는 순서는 다음과 같다. FROM WHERE GROUP BY HAVING SELECT ORDER BY 데이터 질의의 핵심은 가져올 데이터를 최소한으로 효과적으로 가져오는 것이다. 효과적인 질의는 굉장히 많지만 그중에서도 데이터 Full Scan을 피하는 것이 중요하다. Index 열을 WHERE에 하나라도 사용하.. 2022. 6. 7.
K8S CSI Developer Document > Drivers This is a clone page. The original page => Link Name CSI Driver Name Compatible with CSI Version(s) Description Persistence (Beyond Pod Lifetime) Supported Access Modes Dynamic Provisioning Other Features Alicloud Disk diskplugin.csi.alibabacloud.com v1.0 A Container Storage Interface (CSI) Driver for Alicloud Disk Persistent Read/Write Single Pod Yes Raw Block, Snapshot Alicloud NAS nasplugin.c.. 2022. 1. 20.
Mellanox Adapters - Comparison Table This is a clone page. The original page => Link Class Feature ConnectX-3 ConnectX-3 Pro ConnectX-4 ConnectX-4 Lx ConnectX-5 ConnectX-6 Interface Port/Speed options 2 ports of 10/40/56GbE 2 ports of 10/40/56GbE 2 ports of 100/56/50/40/25/10GbE 2 ports of 10/25GbE 1 port of 40/50GbE 2 ports of 100/56/50/40/25/10GbE 2 ports of 200/100/56/50/40/25/10GbE Interface PCIe x8 Gen3 x8 Gen3 x8, x16 Gen3 x8.. 2022. 1. 20.
용어정의 - DataOps DataOps는 IT운영 및 SW개발 팀 간의 협업을 도와, 민첩한 애플리케이션 개발을 위한 DevOps 에서 유래된 용어입니다. DevOps가 애자일한 개발 운영의 이야기라면, DataOps는 애자일한 데이터 운영, 데이터 서비스에 대한 이야기입니다. DataOps는 AI시대에 보다 민첩하고 자동화된 데이터 운영을 제공하기 위한 방법론이며, 쉽게 얘기하면 원하는 데이터를 원하는 곳에 적시에 제공하는, 즉 민첩한 데이터 서비스를 이야기 하는 것입니다. DataOps가 우리에게 필요한 이유는 다음과 같습니다. - 데이터는 더 많아지고 다양해지며 분산되고 격리되고 있습니다. - 저장 및 관리 비용이 계속 증가되며, public cloud provider에 lock-in 되고 있습니다. - 거버넌스 및 규정 .. 2020. 12. 11.
용어정의 - Data Lake (DW, ODS, ELT, Data Mesh) 데이터레이크 라는 용어는 Pentaho의 CTO였던 Jame Dixon이 2010년에 자신의 블로그에 개념을 설명하면서 시작되었습니다.(링크) 그는 Pentaho의 Hadoop 지원 릴리스를 소개하며 기존 DW에서 정제된 데이터는 이미 정의된 질문에만 답변할 수 있어서 다양한 정보를 알기위한 가시성을 해친다고 기술합니다. 그러면서, 아래와 같은 얘기로 마무리 합니다. If you think of a datamart as a store of bottled water – cleansed and packaged and structured for easy consumption – the data lake is a large body of water in a more natural state. The conten.. 2020. 12. 9.
온라인 학습 관리법 - YTN사이언스 코로나19로 인해 급변한 학습 환경! 온라인 학습이 필수가 되었는데... 그래서 수다학이 준비한, 온라인 학습 잘하는 방법! 아이들의 온라인 수업을 어떻게 해야 하는가?? youtu.be/u_SJUAMwt1s 2020. 12. 9.
반응형