WO2018101652A1

WO2018101652A1 - 실감형 미디어 영상을 제공하는 장치

Info

Publication number: WO2018101652A1
Application number: PCT/KR2017/012994
Authority: WO
Inventors: 양지희; 전소연; 김영애; 전지혜; 박구만
Original assignee: 서울과학기술대학교 산학협력단
Priority date: 2016-12-02
Filing date: 2017-11-16
Publication date: 2018-06-07
Also published as: US10681272B2; US20190364207A1; KR101851338B1

Abstract

실감형 미디어 영상을 제공하는 장치는, 객체를 중심으로 배치된 복수의 카메라를 통해 인워드(inward) 방식으로 촬영된 복수의 인워드 영상을 획득하는 인워드영상획득부, 장소의 일 지점을 중심으로 배치된 복수의 카메라를 통해 아웃워드(outward) 방식으로 촬영된 복수의 아웃워드 영상을 획득하는 아웃워드영상획득부, 상기 복수의 아웃워드 영상을 정합하여 360° 실린더 영상을 생성하고, 상기 360° 실린더 영상을 360° 구형 영상으로 변환하여 배경 영상을 생성하는 배경영상생성부, 상기 복수의 인워드 영상으로부터 상기 객체를 추출하여 3차원 객체를 생성하는 3차원객체복원부, 입력장치를 통해 시점 이동 신호 및 상기 객체에 관한 명령 신호를 입력받는 유저인터페이스부, 상기 입력된 시점 이동 신호 및 명령 신호에 기초하여 상기 360° 구형 영상과 상기 3차원 객체를 제어하는 입력신호제어부 및 상기 360° 구형 영상과 상기 3차원 객체를 합성하고, 합성 영상을 디스플레이 장치로 송출하는 합성영상송출부를 포함하도록 구성된다.

Description

실감형 미디어 영상을 제공하는 장치

본 발명은 실감형 미디어 영상을 제공하는 장치에 관한 것이다.

최근 미디어 이용 환경이 실시간 TV 시청에서 온라인 동영상 서비스로 변함에 따라 MCN(Multi Channel Network) 등 1인 미디어, 개인방송 서비스가 차지하는 비율이 높아지는 추세에 있다. 1인 미디어 방송을 위한 콘텐츠 제작과 개인방송 시스템은 중요한 연구 분야로 고려되고 있으며, 특히 MCN 및 콘텐츠 품질에 대한 부분이 급속도로 발전하고 있다. 그러나, 실감 시청에 대한 기술은 아직까지 상용화되지 못하고 연구 차원에서 머물러 있는 실정이다.

또한, 실감 미디어 표출 기법과 관련하여 시청자가 원하는 임의의 위치에서 임의의 방향으로 3차원 장면을 제공해 줄 수 있는 VR(Virtual Reality) 영상 기술이 제시된 바있지만, 대부분 콘텐츠 제작을 중점으로 제시하고 있으며 영상 기술 및 시스템에 대해서는 연구가 필요하다. 특히, 실감 미디어 방송에서 컨텐츠 제공자와 시청자간의 효율적인 정보 교류 방법에 대한 연구가 절실하며, 실감형 미디어 획득 및 효율적인 정보 전달을 위한 연구가 요구되고 있다.

이러한 대용량 영상을 처리하는 방법과 관련하여, 선행기술인 한국공개특허공보 제10-2015-0010752호는 파노라마 기반 3D 비디오 코딩 방법에 관한 것으로, 복수의 카메라들로부터 촬영된 멀티뷰를 스티칭 알고리즘을 통해 파노라마 비디오로 생성하는 구성을 개시하고 있다.

인워드 방식으로 촬영된 영상과 아웃워드 방식으로 촬영된 영상을 결합하여 하나의 360° 영상으로 표출할 수 있는 실감형 미디어 영상을 제공하는 장치를 제공하고자 한다. 사용자에게 현장에 있는 듯한 몰입감과 입체감, 현실감을 줄 수 있는 실감형 미디어 영상을 제공하는 장치를 제공하고자 한다. 사용자가 360° 영상의 상, 하, 좌, 우, 줌 등에 대한 제어를 자유시점으로 관찰할 수 있는 실감형 미디어 영상을 제공하는 장치를 제공하고자 한다. 3D 객체 모델링를 통해 콘텐츠 내에서 움직이는 객체를 선택 및 제어할 수 있는 실감형 미디어 영상을 제공하는 장치를 제공하고자 한다. 다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예는, 실감형 미디어 영상을 제공하는 장치에 있어서, 객체를 중심으로 배치된 복수의 카메라를 통해 인워드(inward) 방식으로 촬영된 복수의 인워드 영상을 획득하는 인워드영상획득부, 장소의 일 지점을 중심으로 배치된 복수의 카메라를 통해 아웃워드(outward) 방식으로 촬영된 복수의 아웃워드 영상을 획득하는 아웃워드영상획득부, 상기 복수의 아웃워드 영상을 정합하여 360° 실린더 영상을 생성하고, 상기 360° 실린더 영상을 360° 구형 영상으로 변환하여 배경 영상을 생성하는 배경영상생성부, 상기 복수의 인워드 영상으로부터 상기 객체를 추출하여 3차원 객체를 생성하는 3차원객체복원부, 입력장치를 통해 시점 이동 신호 및 상기 객체에 관한 명령 신호를 입력받는 유저인터페이스부, 상기 입력된 시점 이동 신호 및 명령 신호에 기초하여 상기 360° 구형 영상과 상기 3차원 객체를 제어하는 입력신호제어부 및 상기 360° 구형 영상과 상기 3차원 객체를 합성하고, 합성 영상을 디스플레이 장치로 송출하는 합성영상송출부를 포함하는, 실감형 미디어 영상 제공 장치를 제공할 수 있다.

상기 왜곡보정부는, 상기 객체와 일정 거리에 떨어져 배치된 상기 복수의 카메라로부터 교정패턴영상을 획득하는 교정패턴영상획득부, 상기 복수의 카메라의 렌즈 초점 거리와 상기 객체의 위치에 기초하여 내부 파라미터를 산출하고, 상기 복수의 카메라의 위치 정보에 기초하여 외부 파라미터를 산출하는 파라미터산출부, 및 상기 내부 파라미터와 상기 외부 파라미터에 기초하여 상기 복수의 카메라의 왜곡 모델을 추정하는 왜곡 모델 추정부를 포함하는 것일 수 있다.

상기 3차원객체복원부는, 상기 왜곡 보정된 복수의 인워드 영상으로부터 상기 객체와 배경을 분할시켜 상기 객체만을 추출하는 객체추출부, 상기 내부 파라미터와 상기 외부 파라미터를 이용하여 상기 객체의 3차원 정보를 추출하고, 상기 3차원 정보에 기초하여 3차원 메시를 생성하는 3차원정보추출부 및 상기 3차원 메시에 색상값을 부여하는 텍스쳐맵핑부를 포함하는 것일 수 있다.

상기 배경영상생성부는, 상기 복수의 아웃워드 영상을 실린더 좌표 변환계를 이용하여 실린더에 투영하는 실린더투영부, 상기 복수의 아웃워드 영상의 크기, 위치 및 조명 중 적어도 하나의 특징을 추출하는 시프트알고리즘부, 상기 특징에 기초하여 설정값 이하의 오류를 가지는 호모그래피를 추정하여 상기 복수의 아웃워드 영상을 정합시키는 호모그래피추정부, 및 상기 정합된 영상의 색상을 보정하는 색상보정부를 포함하는 것일 수 있다.

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.

전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 인워드 방식으로 촬영된 영상과 아웃워드 방식으로 촬영된 영상을 결합하여 하나의 360° 영상으로 표출할 수 있는 실감형 미디어 영상을 제공하는 장치를 제공할 수 있다. 사용자에게 현장에 있는 듯한 몰입감과 입체감, 현실감을 줄 수 있는 실감형 미디어 영상을 제공하는 장치를 제공할 수 있다. 사용자가 360° 영상의 상, 하, 좌, 우, 줌 등에 대한 제어를 자유시점으로 관찰할 수 있는 실감형 미디어 영상을 제공하는 장치를 제공할 수 있다. 3D 객체 모델링를 통해 콘텐츠 내에서 움직이는 객체를 선택 및 제어할 수 있는 실감형 미디어 영상을 제공하는 장치를 제공할 수 있다.

도 1은 본 발명의 일 실시예에 따른 실감형 미디어 영상 제공 시스템의 구성도이다.

도 2는 본 발명의 일 실시예에 따른 실감형 미디어 영상 제공 장치의 구성도이다.

도 3은 본 발명의 일 실시예에 따른 인워드 촬영 방식을 설명하기 위한 도면이다.

도 4는 본 발명의 일 실시예에 따른 아웃워드 촬영 방식을 설명하기 위한 도면이다.

도 5는 본 발명의 일 실시예에 따른 왜곡보정부의 구성도이다.

도 6은 본 발명의 일 실시예에 따른 3차원객체복원부의 구성도이다.

도 7은 본 발명의 일 실시예에 따른 배경영상생성부의 구성도이다.

도 8은 본 발명의 일 실시예에 따른 실감형 미디어 영상을 제공하는 방법을 나타낸 흐름도이다.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다.

본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.

이하 첨부된 도면을 참고하여 본 발명의 일 실시예를 상세히 설명하기로 한다. 도 1은 본 발명의 일 실시예에 따른 실감형 미디어 영상 제공 시스템의 구성도이다.

도 1을 참조하면, 실감형 미디어 영상 제공 시스템(1)은 복수의 카메라(100), 실감형 미디어 영상 제공 장치(200) 및 디스플레이 장치(300)를 포함할 수 있다. 도 1에 도시된 복수의 카메라(100), 실감형 미디어 영상 제공 장치(200) 및 디스플레이 장치(300)는 실감형 미디어 영상 제공 시스템(1)에 의하여 제어될 수 있는 구성요소들을 예시적으로 도시한 것이다.

도 1의 실감형 미디어 영상 제공 시스템(1)의 각 구성요소들은 일반적으로 네트워크(network)를 통해 연결될 수 있다. 네트워크는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크의 일 예는, Wi-Fi, 블루투스(Bluetooth), 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), 3G, 4G, LTE 등이 포함되나 이에 한정되지는 않는다.

복수의 카메라(100)는 인워드(inward) 방식으로 객체를 촬영하여 복수의 인워드 영상을 생성할 수 있다. 복수의 인워드 영상은 객체에 대한 다시점 영상으로서, 객체에 대한 360° 뷰(view)를 촬영한 영상일 수 있다.

복수의 카메라(100)는 인워드 영상을 촬영 시 객체를 중심으로 하며, 제 1 반지름을 가지는 원환상에 배치될 수 있다. 복수의 카메라(100)의 배치 구조는 이에 제한되지 않으며, 객체를 중심으로 하는 층상 구조의 반구 형상 등으로 배치될 수도 있다.

복수의 카메라(100)는 객체를 크로마키 배경 내에서 촬영할 수 있다

복수의 카메라(100)는 아웃워드(outward) 방식으로 배경을 촬영하여 복수의 아웃워드 영상을 생성할 수 있다.

복수의 카메라(100)는 아웃워드 영상을 촬영 시 장소의 일 지점을 중심으로 하며, 제 2 반지름을 가지는 원환상에 배치될 수 있다. 예를 들어, 인워드 영상 촬영 시의 제 1 반지름과 아웃워드 영상 촬영 시의 제 2 반지름은 동일할 수 있다. 예컨대, 복수의 카메라(100)는 동일한 프레임에 설치되고, 카메라 렌즈의 방향만 내측에서 외측으로 회전하여 복수의 인워드 영상과 복수의 아웃워드 영상을 촬영할 수 있다. 이와 달리, 제 1 반지름과 제 2 반지름은 상이할 수도 있다.

복수의 카메라(100)는 복수의 인워드 영상 및 복수의 아웃워드 영상을 실감형 미디어 영상 제공 장치(200)로 제공할 수 있다.

실감형 미디어 영상 제공 장치(200)는 복수의 카메라(100)로부터 복수의 인워드 영상 및 복수의 아웃워드 영상을 획득할 수 있다.

실감형 미디어 영상 제공 장치(200)는 복수의 인워드 영상의 왜곡을 보정하고, 복수의 인워드 영상으로부터 상기 객체를 추출하여 3차원 객체를 생성할 수 있다.

실감형 미디어 영상 제공 장치(200)는 복수의 아웃워드 영상을 정합하여 360°배경 영상을 생성할 수 있다.

실감형 미디어 영상 제공 장치(200)는 인터페이스를 통해 시점 이동 신호 및 객체에 관한 명령 신호를 입력받고, 입력된 시점 이동 신호 및 명령 신호에 기초하여 360° 배경 영상과 3차원 객체를 제어할 수 있다.

실감형 미디어 영상 제공 장치(200)는 제어된 배경 영상과 3차원 객체를 합성하고, 합성 영상을 디스플레이 장치(300)로 송출할 수 있다.

디스플레이 장치(300)는 실감형 미디어 영상 제공 장치(200)로부터 실감형 미디어 영상을 수신하여 표시할 수 있는 단말로서, 셋톱박스(STB), 스마트폰(smart phone), 스마트 안경(smart glasses), 스마트 패드(smart pad), 타블랫 PC(Tablet PC), 3G, 4G, 5G 단말, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet), PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000 등을 포함할 수 있다.

디스플레이 장치(300)는 리모콘, 키보드, 마우스, 터치패드, 모션센서, 눈동자 센서 또는 마이크와 같은 입력 장치(미도시)와 연결될 수 있다. 디스플레이 장치(300)는 입력 장치를 통해 객체의 선택, 동작 및 이동에 관한 명령 신호, 또는 상하좌우, 줌인, 줌아웃에 관한 시점 이동 신호를 입력 받고, 이를 실감형 미디어 영상 제공 장치(200)로 전송할 수 있다.

이하 도 2를 참조하여 실감형 미디어 영상 제공 장치(200)에 대해 상세히 설명하도록 한다.

도 2는 본 발명의 일 실시예에 따른 실감형 미디어 영상 제공 장치의 구성도이다. 도 2를 참조하면, 실감형 미디어 영상 제공 장치(200)는 인워드 영상 획득부(210), 아웃워드 영상 획득부(220), 왜곡 보정부(230), 3차원 객체 복원부(240), 배경영상 생성부(250), 유저 인터페이스부(260), 입력신호 제어부(270), 및 합성 영상 송출부(280)를 포함할 수 있다.

인워드 영상 획득부(210)는, 복수의 카메라 또는 DB나 외부 서버로부터 복수의 인워드 영상을 획득할 수 있다. 이하 도 3을 참조하여, 인워드 영상에 대해 설명하도록 한다.

도 3은 본 발명의 일 실시예에 따른 인워드 촬영 방식을 설명하기 위한 도면이다. 도 3을 참조하면, 복수의 카메라(100)는 객체(310)를 중심으로 배치되어 내측 방향을 향해 객체(310)를 촬영할 수 있다. 복수의 카메라(100)는 객체(310)로부터 일정 거리 떨어진 원환 형상으로 배치될 수 있다.

도 3에는 8대의 카메라가 도시되어 있으나, 카메라의 개수는 이에 제한되지 않으며, 이보다 적거나 많을 수 있다. 객체를 중심으로 배치된 복수의 카메라(100)로부터 객체(310)에 대한 다중 인워드 영상을 획득할 수 있다.

도 2로 돌아와서, 아웃워드 영상 획득부(220)는 복수의 카메라 또는 DB나 외부 서버로부터 복수의 아웃워드 영상을 획득할 수 있다. 이하, 도 4를 참조하여, 아웃워드 영상에 대해 설명하도록 한다.

도 4는 본 발명의 일 실시예에 따른 아웃워드 촬영 방식을 설명하기 위한 도면이다. 도 4를 참조하면, 복수의 카메라(100)는 장소의 일 지점을 중심으로 배치되어 외측 방향을 향해 배경(410)을 촬영할 수 있다. 복수의 카메라(100)는 일 지점으로부터 일정 거리 떨어진 원환 형상으로 배치될 수 있다.

아웃워드 영상 촬영 시 이용되는 카메라의 개수는 인워드 영상 촬영 시 이용되는 카메라의 개수와 동일하거나 상이할 수 있으며, 카메라의 배치구조는 카메라의 방향이 내측에서 외측으로 변경되는 것을 제외하고 동일할 수 있다.

도 2로 돌아와서, 왜곡 보정부(230)는 복수의 인워드 영상의 왜곡을 보정할 수 있다. 이하 도 5를 참조하여, 왜곡 보정부(230)의 세부 구성을 설명하도록 한다.

도 5는 본 발명의 일 실시예에 따른 왜곡보정부의 구성도이다. 도 5를 참조하면, 왜곡 보정부(230)는 교정패턴영상획득부(510), 파라미터산출부(520), 및 왜곡 모델 추정부(530)를 포함할 수 있다.

교정패턴영상획득부(510)는 객체와 일정 거리에 떨어져 배치된 복수의 카메라로부터 교정패턴영상을 획득하고, 격자점을 검출할 수 있다.

파라미터산출부(520)는 복수의 카메라의 렌즈 초점 거리와 객체의 위치에 기초하여 내부 파라미터를 산출할 수 있다. 파라미터산출부(520)는 복수의 카메라의 위치 정보에 기초하여 외부 파라미터를 산출할 수 있다.

왜곡모델추정부(530)는 내부 파라미터와 외부 파라미터에 기초하여 복수의 카메라의 왜곡 모델을 추정하고, 추정된 왜곡 모델을 이용하여 카메라의 왜곡을 보정할 수 있다. 예컨대, 추정된 왜곡 모델로부터 역으로 코너점을 다시 추출하여 검증하고, 검증된 카메라 모델을 이용하여 영상의 왜곡을 보정할 수 있다.

도 2로 돌아와서, 3차원객체복원부(240)는 복수의 인워드 영상으로부터 객체를 추출하여 3차원 객체를 생성할 수 있다. 이하 도 6을 참조하여 3차원객체복원부(240)의 세부 구성에 대해서 설명하도록 한다.

도 6은 본 발명의 일 실시예에 따른 3차원객체복원부의 구성도이다. 도 3을 참조하면, 3차원객체복원부(240)는 객체추출부(610), 3차원정보추출부(620), 및 텍스쳐맵핑부(630)를 포함할 수 있다.

객체추출부(610)는 왜곡 보정된 복수의 인워드 영상으로부터 움직이는 객체와 배경을 분할시켜 객체만을 추출할 수 있다.

객체추출부(610)는 복수의 인워드 영상로부터 객체를 추적하여 추출하고, 객체가 서로 겹쳐진 영상이 있다면 제거하는 과정을 거쳐 객체정보를 수집할 수 있다. 예를 들어, 배경은 고정되어 있고, 객체는 움직이고 있기 때문에 t프레임과 t-1프레임의 차이값이 움직인 영역이라고 판단하여 객체를 추출할 수 있다.

객체추출부(610)는 움직이는 객체를 추적하여 객체를 배경으로부터 분리시켜 각 뷰의 객체정보를 획득한 후, 3D모델링을 하기 위하여 각 뷰의 객체크기를 동일하게 형성시킬 수 있다. 예를 들어, n개의 시점에 대한 x개의 객체들의 크기정보를 획득하고, 각 시점에서 필요한 각 객체의 크기를 정하고, 필요한 크기에 맞게 다른 시점에서 각 객체이미지들의 크기를 변환시킬 수 있다. 크기를 같게 변환하기 위해서 왜곡된 영상을 보정해야 하는데 이때, 프로젝티브(projective) 변환을 이용할 수 있다.

객체추출부(610)는 객체의 추출을 위해서 카메라 캘리브레이션 과정을 수행하여 복수의 카메라의 파라미터를 산출할 수 있다.

객체추출부(610)는 정확한 객체추출을 위하여 1차로 혼합가우시안 추출부, 2차로 대비지도·움직임정보부, 3차로 계층적 영역 구조부를 이용하여 구성될 수 있다.

혼합가우시안 추출부(Mixure of Gaussian, MoG)는 배경화소모델을 구하고, 배경모델링 기법으로 객체를 분리한 후, 미디언 필터와 모폴로지 연산을 통해 잡음을 제거하여 임계값을 이용하여 객체를 추출하도록 구성될 수 있다.

대비지도·움직임정보부는 대비지도와 웨이블렛 변환을 이용하여 중요 특징점을 찾아내고 이를 이용하여 대략적인 집중윈도우(AW:Attention Window)를 생성하여 움직임 정보를 추정하고, 윤곽선 차이를 추출하여 객체를 추출할 수 있다.

계층적영역구조부는 워터쉐드 알고리즘을 이용하여 영상을 분할하고, 분할된 영역 중 유사한 속성을 가진 영역을 병합하여 계층 구조를 만들어 객체를 추출할 수 있다.

3차원정보추출부(620)는 내부 파라미터와 외부 파라미터를 이용하여 객체의 3차원 정보를 추출하고, 3차원 정보에 기초하여 3차원 메시를 생성할 수 있다.

3차원정보추출부(620)는 객체의 기하 정보를 복원하기 위하여 비쥬얼 헐(Visual Hull)을 생성시키고, 이를 이용하여 3차원 메시를 생성할 수 있다. 여기서, 비쥬얼 헐은 물체를 배경으로부터 분리시켜 임계값을 이용하여 2D 실루엣 이미지를 만든 후, 각 뷰의 실루엣 콘들의 교차점으로서, 쉐이프-프럼-실루엣 3D 복원을 이용하여 획득할 수 있다.

3차원정보추출부(620)는 비쥬얼 헐을 연산하기 위하여 광선투사법을 이용하여 각 뷰의 이미지에서 3차원 광선을 투사하고, 투사된 광선의 교차점의 씨에스지(CSG)를 구할 수 있다.

3차원정보추출부(620)는 비주얼 헐 정보가 모두 연산되면, 복원된 기하정보를 이용하여 3차원 객체의 표면상에 존재하는 점 간의 연결성 정보를 이용하여 3차원 물체를 최소한의 공간으로 감싸는 외피를 찾아 3차원 메시를 생성할 수 있다.

텍스쳐맵핑부(630)는 3차원 메시에 색상값을 부여할 수 있다. 텍스쳐맵핑부(630)는 3차원 메시의 각각 표면 다각형의 꼭지점 혹은 다각형 전체에 색상값을 할당할 수 있다. 이를 통해, 사용자에게 현실감과, 사실감을 제공할 수 있다.

도 2로 돌아와서, 배경영상생성부(250)는 복수의 아웃워드 영상을 정합하여 360° 실린더 영상을 생성하고, 360° 실린더 영상을 360° 구형 영상으로 변환하여 배경 영상을 생성할 수 있다. 이하 도 7을 참조하여, 배경영상생성부(250)의 세부 구성에 대해서 설명하도록 한다.

도 7은 본 발명의 일 실시예에 따른 배경영상생성부의 구성도이다. 도 7을 참조하면, 배경영상생성부(250)는 실린더투영부(710), 시프트알고리즘부(720), 호모그래피추정부(730) 및 색상보정부(740)을 포함할 수 있다.

실린더투영부(710)는 복수의 아웃워드 영상을 실린더 좌표 변환계를 이용하여 실린더에 투영할 수 있다. 실린더투영부(710)는 배경들의 특징점을 추출하고, 영상을 재정렬하여 정합한다. 이는 정확한 구형 영상 생성에 대한 좌표를 표출하기 위함이다.

시프트알고리즘부(720)는 복수의 아웃워드 영상의 크기, 위치 및 조명 중 적어도 하나의 특징을 추출할 수 있다. 시프트알고리즘부(720)는 다시점 영상 중에서 크기, 회전, 조명에 관한 불변인 특징을 추출할 수 있으며, 이를 통해 영상 간의 정확한 대응관계를 찾을 수 있다.

호모그래피추정부(730)는 스프트알고리즘부(720)에서 추출한 특징에 기초하여 설정값 이하의 오류를 가지는 호모그래피를 추정하여 상기 복수의 아웃워드 영상을 정합할 수 있다.

호모그래피추정부(730)는 일치하는 특징점들 사이에서 직접선형변환식을 이용하여 최소의 오류를 갖는 호모그래피를 추정하여 영상정합시킬 수 있다.

색상보정부(740)는 정합된 영상의 색상을 보정할 수 있다. 색상보정부(740)는 정합된 영상 내의 색상톤의 차이를 최소화 시켜 하나의 카메라로 영상을 촬영한 듯한 느낌을 줄 수 있는 실감 영상을 생성할 수 있다.

배경영상생성부(250)는, 도시하지 않았지만, 생성된 파노라마 영상을 사용자가 원하는 대로 자유시점의 영상을 볼 수 있도록 360도 구형 영상을 생성시키고 디스플레이 장치로 표출할 수 있도록 처리해주는 구형표출처리부를 더 포함할 수 있다.

구형표출처리부는 파노라마 영상을 360도 구형 영상으로 표출할 수 있도록 그래픽적으로 렌더링 한다. 구형표출처리부는 획득된 2차원 영상을 3차원 영상 좌표계로 변환하는 함수를 사용하며, 3차원 영상을 실시간으로 표출할 수 있다.

도 2로 돌아와서, 유저 인터페이스부(260)는 입력장치를 통해 시점 이동 신호 및 객체에 관한 명령 신호를 입력받을 수 있다.

유저 인터페이스부(260)는 입력 장치를 통해 객체의 선택, 동작 및 이동에 관한 명령 신호 또는 상하좌우, 줌인, 줌아웃에 관한 시점 이동 신호를 입력받을 수 있다.

입력장치 디스플레이 장치에 연결되며, 모션센서, 립모션 센서, 눈동자 센서로 구성되는 경우 사용자의 제스처를 통해 객체 및 시점을 제어할 수 있는 NUI(Natural User Interface) 서비스를 제공할 수 있다.

입력신호 제어부(270)는 유저 인터페이스부(260)를 통해 입력된 시점 이동 신호 및 명령 신호에 기초하여 360° 배경 영상과 3차원 객체를 제어할 수 있다.

입력신호 제어부(270)는 시점 이동 신호에 따라 360° 배경 영상을 상, 하, 좌, 우, 줌 기능을 수행할 수 있도록 처리함으로써 사용자가 실시간으로 구형 영상을 자유자재로 볼 수 있도록 할 수 있다.

입력신호 제어부(270)는 명령 신호를 객체에 매핑하여 객체를 선택, 이동, 회전시킬 수 있다.

합성 영상 송출부(280)는 배경영상생성부(250)에서 생성된 360° 배경 영상과 3차원객체복원부(240)에서 생성된 3차원 객체를 합성하고, 합성 영상을 디스플레이 장치로 송출할 수 있다.

합성 영상 송출부(280)는 3차원 객체와 배경영상이 서로 매칭되어 정합되도록 영상 특징점을 검출하고 합성할 수 있다.

합성 영상 송출부(280)는 입력된 명령 신호 및 시점 이동 신호에 기초하여 객체와 영상을 하이브리드식으로 결합하고, 1:1 맞춤형 자유시점영상을 생성하여 디스플레이 장치로 송출할 수 있다.

도 8에 도시된 실시예에 따른 실감형 미디어 영상을 제공하는 방법은 도 1에 도시된 실시예에 따른 실감형 미디어 영상 제공 시스템(1)에서 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1에 도시된 실시예에 따른 실감형 미디어 영상 제공 시스템(1)에 관하여 이미 기술된 내용은 도 8에 도시된 실시예에 따른 실감형 미디어 영상을 제공하는 방법에도 적용된다.

도 8을 참조하면, 단계 S810에서 복수의 인워드 영상을 획득하고, 단계 S820에서 복수의 아웃워드 영상을 획득한다. 단계 S830에서 복수의 인워드 영상으로부터 객체를 추출하여 3차원 객체를 생성하고, 단계 S840에서 복수의 아웃워드 영상을 정합하여 배경영상을 생성한다.

단계 S850에서 시점 이동 신호 및/또는 객체 명령 신호를 입력받고, 단계 S860에서 배경영상과 3차원 객체를 제어한다. 단계 S870에서 배경영상과 3차원 객체를 합성하여 디스플레이 장치로 송출한다.

상술한 설명에서, 단계 S810 내지 S870은 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.

도 8에서 설명한 본 발명의 일 실시예에 따른 실감형 미디어 영상을 제공하는 방법은 컴퓨터에 의해 실행되는 매체에 저장된 컴퓨터 프로그램 또는 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.

본 발명의 일 실시예에 따른 실감형 미디어 영상 제공 장치는 1대다의 양방향 소통, N스크린 기반의 스마트 기기, 시청 환경 등을 고려한 다양한 콘텐츠 제작 및 영상 표출 기술에 적용 가능하며, 개발 시청자와 교감하는 맞춤형 인터랙티브 방송기술의 고품질화에 기여할 수 있다.

인터넷 연결이 가능한 환경 하에서 필드테스트를 통한 검증된 기술을 확보 할 수 있고, 차세대 입체 방송서비스에 활용 가능한 자유시점 영상 및 음향의 연동이 가능한 서비스를 제공함으로써 기술 경쟁력을 강화할 수 있다.

또한, 실감형 개인방송 서비스를 통한 교육, 광고 및 다양한 엔터테인먼트, 서비스 연계를 통한 차세대 개인방송의 서비스망을 구축할 수 있다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims

실감형 미디어 영상을 제공하는 장치에 있어서,

객체를 중심으로 배치된 복수의 카메라를 통해 인워드(inward) 방식으로 촬영된 복수의 인워드 영상을 획득하는 인워드영상획득부;

장소의 일 지점을 중심으로 배치된 복수의 카메라를 통해 아웃워드(outward) 방식으로 촬영된 복수의 아웃워드 영상을 획득하는 아웃워드영상획득부;

상기 복수의 아웃워드 영상을 정합하여 360° 실린더 영상을 생성하고, 상기 360° 실린더 영상을 360° 구형 영상으로 변환하여 배경 영상을 생성하는 배경영상생성부;

상기 복수의 인워드 영상으로부터 상기 객체를 추출하여 3차원 객체를 생성하는 3차원객체복원부;

입력장치를 통해 시점 이동 신호 및 상기 객체에 관한 명령 신호를 입력받는 유저인터페이스부;

상기 입력된 시점 이동 신호 및 명령 신호에 기초하여 상기 배경 영상과 상기 3차원 객체를 제어하는 입력신호제어부; 및

상기 배경 영상과 상기 3차원 객체를 합성하고, 합성 영상을 디스플레이 장치로 송출하는 합성영상송출부

를 포함하는, 실감형 미디어 영상 제공 장치.
제 1 항에 있어서,

상기 복수의 인워드 영상의 왜곡을 보정하는 왜곡보정부를 더 포함하고,

상기 왜곡보정부는,

상기 객체와 일정 거리에 떨어져 배치된 상기 복수의 카메라로부터 교정패턴영상을 획득하는 교정패턴영상획득부;

상기 복수의 카메라의 렌즈 초점 거리와 상기 객체의 위치에 기초하여 내부 파라미터를 산출하고, 상기 복수의 카메라의 위치 정보에 기초하여 외부 파라미터를 산출하는 파라미터산출부; 및

상기 내부 파라미터와 상기 외부 파라미터에 기초하여 상기 복수의 카메라의 왜곡 모델을 추정하는 왜곡모델추정부

를 포함하는 것인, 실감형 미디어 영상 제공 장치.
제 2 항에 있어서,

상기 3차원객체복원부는,

상기 왜곡 보정된 복수의 인워드 영상으로부터 상기 객체와 배경을 분할시켜 상기 객체만을 추출하는 객체추출부;

상기 내부 파라미터와 상기 외부 파라미터를 이용하여 상기 객체의 3차원 정보를 추출하고, 상기 3차원 정보에 기초하여 3차원 메시를 생성하는 3차원정보추출부; 및

상기 3차원 메시에 색상값을 부여하는 텍스쳐맵핑부

를 포함하는 것인, 실감형 미디어 영상 제공 장치.
제 1 항에 있어서,

상기 배경영상생성부는,

상기 복수의 아웃워드 영상을 실린더 좌표 변환계를 이용하여 실린더에 투영하는 실린더투영부;

상기 복수의 아웃워드 영상의 크기, 위치 및 조명 중 적어도 하나의 특징을 추출하는 시프트알고리즘부;

상기 특징에 기초하여 설정값 이하의 오류를 가지는 호모그래피를 추정하여 상기 복수의아웃워드 영상을 정합시키는 호모그래피추정부; 및

상기 정합된 영상의 색상을 보정하는 색상보정부

를 포함하는 것인, 실감형 미디어 영상 제공 장치.
제 1 항에 있어서,

상기 복수의 인워드 영상은 제 1 반지름을 가지는 원환상에 배치된 복수의 카메라를 통해 크로마키 배경내에서 촬영된 것이고,

상기 복수의 아웃워드 영상은, 제 2 반지름을 가지는 원환상에 배치된 복수의 카메라를 통해 촬영된 것이며,

상기 제 1 반지름과 상기 제 2 반지름은 동일한 것인, 실감형 미디어 영상 제공 장치.