본문 바로가기

전체 글226

[python] setup.py python setup.py는 Python 패키지를 설치하거나 배포하기 위한 스크립트를 실행하는 데 사용됩니다. 보통 이 스크립트는 패키지의 메타데이터 및 설치 및 배포에 관련된 설정을 정의합니다. 이 스크립트는 일반적으로 패키지를 빌드하고 설치하며, 다른 사용자들이 패키지를 배포하고 설치할 수 있게 합니다. 여기에 간단한 setup.py 파일의 예제를 제시하겠습니다. 이 예제는 가상의 패키지를 만들고, 패키지의 이름, 버전, 저자 등과 같은 메타데이터를 설정하는 방법을 보여줍니다. from setuptools import setup setup( name='mypackage', version='1.0.0', author='Your Name', author_email='your.email@example.c.. 2023. 11. 21.
[Pandas] 데이터프레임의 요소 간 비교 및 조작 판다스(Pandas)는 파이썬에서 데이터 조작과 분석을 위한 라이브러리로 많이 사용됩니다. 데이터프레임(DataFrame)은 판다스에서 가장 중요한 데이터 구조 중 하나로, 표 형식의 데이터를 다루는데 사용됩니다. 판다스는 데이터프레임을 다루는 데 도움이 되는 다양한 비교 함수를 제공합니다. 이러한 함수들은 데이터프레임의 요소 간 비교 및 조작을 수행하는데 사용됩니다. 데이터프레임 비교 함수 eq() 데이터프레임과 다른 데이터프레임 또는 스칼라와의 동등성(같음) 비교를 수행합니다. 두 데이터프레임 또는 데이터프레임과 스칼라를 비교하고, 같은 값이면 True를 반환하고, 다른 값이면 False를 반환합니다. result = df1.eq(df2) # df1과 df2를 요소별로 비교 ne() 데이터프레임과 다.. 2023. 11. 6.
유저베이스, 아이템베이스 추천시스템 유저베이스(Userbase) 추천 시스템 유저베이스 추천 시스템은 사용자와 비슷한 성향 또는 행동 패턴을 가진 다른 사용자에게 추천을 하는 방식입니다. 주요 아이디어는 "이 사용자와 유사한 사용자들이 무엇을 좋아하는가?"를 분석하여 추천을 제공하는 것입니다. 이 방식은 협업 필터링(Collaborative Filtering)의 일부로 사용되며 사용자-사용자 협업 필터링이라고도 불립니다. 이 방식은 사용자 간의 상호작용 데이터(예: 사용자가 상품을 구매하거나 평가한 데이터)에 의존합니다. 유저베이스 추천 시스템의 장점은 개인화된 추천을 제공할 수 있고, 새로운 상품에 대한 추천을 할 수 있습니다. 하지만 데이터 희소성 문제와 추천의 출발점인 초기 사용자에게 추천하기 어렵다는 단점이 있습니다. 아이템베이스(.. 2023. 10. 26.
제1회 국민대학교 AI빅데이터 분석 경진대회 [배경] 국민대학교 경영대학원 AI빅데이터/디지털마케팅전공과 경영대학에서 ‘제1회 국민대학교 AI빅데이터 분석 경진대회’를 개최합니다. 이번 대회에서는 Total HR Service를 제공하는 (주)스카우트의 후원을 받아 유연한 노동시장으로의 변화 흐름에 맞추어, 구직자 입장에서는 자신의 이력과 경력에 맞춤화된 채용 공고를 추천받을 수 있고 구인기업 입장에서는 공고에 적합한 인재를 미리 선별하는 도구로 활용할 수 있도록 채용공고 추천 알고리즘 개발을 제안합니다. 이력서 등 구직자 관련 데이터와 채용 공고 관련 데이터, 그리고 지원 히스토리 데이터를 활용하여 구직자에게 맞춤화된 채용 공고를 자동으로 추천할 수 있는 알고리즘을 개발함에 따라 지원자는 적성에 맞는 채용 공고에 지원하여 직무 만족도를 높이고 구.. 2023. 10. 22.
GIS 데이터 파일(SHP, SHX, DBF) Shapefile은 지리정보 시스템(GIS)에서 공간 데이터를 저장하는 데 사용되는 일반적인 형식 중 하나입니다. Shapefile은 여러 파일로 구성되며, 이 파일들은 다양한 유형의 정보를 저장하고 지리 데이터를 효과적으로 관리합니다. Shapefile은 주로 지리 공간 데이터와 해당 속성 데이터를 함께 저장하며, 다음과 같은 파일로 구성됩니다: .shp 파일 (Shapefile) .shp 파일은 지리 정보를 저장하는 핵심 파일로, 지리적 요소의 지오메트리(Geometry)를 정의합니다. 이 파일에는 점, 선, 면 등 지오메트리 유형에 대한 정보가 포함됩니다. 포인트 데이터(점): .shp 파일은 지도 상의 여러 위치를 정의할 수 있습니다. 예를 들어, GPS 좌표로 표현된 도시의 위치를 저장할 수 있.. 2023. 10. 17.
지리 정보 시스템(GIS, Geographic Information System) GIS는 지리 정보 시스템( Geographic Information System)의 약자로, 지리 공간 데이터를 수집, 저장, 분석, 표현하고 관리하기 위한 컴퓨터 기반의 시스템입니다. GIS는 지리 정보와 관련된 다양한 데이터를 효율적으로 다룰 수 있도록 설계되었습니다. 다음은 GIS의 주요 특징과 역할에 대한 설명입니다. 주요 특징과 역할 지리 정보 수집: GIS는 지리 데이터를 다양한 방식으로 수집합니다. 이러한 데이터는 위성 사진, GPS 위치 데이터, 지도, 공간적 특징의 형상 파일 등 다양한 소스에서 나올 수 있습니다. 지리 데이터 저장: GIS는 수집한 지리 데이터를 저장하고 관리하는 역할을 합니다. 이러한 데이터는 다양한 형식으로 저장되며, 일반적으로 데이터베이스 시스템이나 파일 형식으로.. 2023. 10. 17.
고양이 자라투스트라는 이렇게 말했다 작가 : 스베틀라나 페트로바, 고양이 자라투스트라 출판사 : 세종서적 내용 : 시대별, 나라별 각각의 명화에 고양이 자라투스트라를 자연스럽게 합성하여 합성된 사진이 원작이었고 모종의 이유로 고양이가 빠졌음을 이야기 하고있습니다. 소감 : 최근에 잠실에서 진행된 CAT ART : 고양이 마술사 전시회를 다녀왔습니다. 다녀온 뒤 전시회 내용이 꽤 괜찮았다고 생각해서 주변에 이야기를 조금 했는데 그 중 한명이 이 책의 내용이 전시회의 내용과 유사하다며 책을 빌려 주었습니다. 그래서 읽고 있던 책도 거의 다 읽어가고 고양이도 좋아하기에 감사히 받아 읽기 시작했습니다. 읽기 시작하니 확실히 전시회와 책이 많이 유사하다는 것을 느꼈습니다. 그래서 둘 중 한명은 다른 한명에게 영향을 받아 작품을 만들게 되지 않았을까.. 2023. 10. 9.
꿀벌의 예언 작가 : 베르나르 베르베르 출판사 : 열린책들 소감 : 베르나르 베르베르 옛날에 참 좋아했던 작가입니다. 나무, 파피용, 아버지들의 아버지, 타나토노트에서부터 시작해서 신으로 끝나는 시리즈 모두 작가의 상상력과 글의흐름이 잘 어울려 정말 재밌게 읽었습니다. 하지만 웃음, 카산드라의 거울 이 때 쯤부터는 이미 작가에게 익숙해 진것인지 크게 색다르게 다가오는 부분이 없어서인지 점점 흥미가 떨어졌던 것 같습니다. 그래서 이번에 꿀벌의 예언을 시작하기 전에도 조금 걱정을 했지만 과거와 미래의 다른 삶을 오간다는 소재가 좋았기에 일단 읽기 시작했습니다. 그렇게 읽기 시작하여 초반부에는 베르나르의 글이 재미없는 것도 아니고 소재의 흥미가 떨어지는 것도 아니기에 계속 읽었습니다만, 읽어감에 따라서 책을 읽는 원동력이.. 2023. 10. 9.
XGBoost XGBoost는 Gradient Boosting 알고리즘을 기반으로 한 머신 러닝 라이브러리로, 특히 분류 및 회귀 문제에서 높은 예측 성능을 제공하는 인기 있는 알고리즘 중 하나입니다. "Extreme Gradient Boosting"의 약자로, 데이터 분석 및 예측 모델링 작업에 널리 사용됩니다. 아래는 XGBoost의 주요 특징과 장점에 대한 간략한 소개입니다: XGBoost의 특장점 Gradient Boosting 기반 XGBoost는 Gradient Boosting 알고리즘을 사용하여 약한 예측 모델(일반적으로 의사 결정 트리)을 연속적으로 개선하며 강력한 앙상블 모델을 생성합니다. Regularization XGBoost는 모델의 복잡성을 제어하기 위한 L1(Lasso) 및 L2(Ridge) .. 2023. 10. 2.